“Arama motorlarından gelen kullanıcılar için çok fazla değer yaratmayan veya otomatik olarak oluşturulmuş sayfaların taranmasını önlemek için robots.txt kullanın.”
- Google web yöneticisi kuralları
Google'ı Engellemek
Web sitenizi daha üst sıraya taşıyabilmenizin bir yolu olarak sayfalarınızın bazıları için Googlebot’u engellemek biraz garip görünebilir; ancak bu yapılan bir şeydir.
Genellikle sitelerdeki arama sonucu sayfaları buna örnek olarak verilebilir. Birisi web sitenizi her aradığında bir arama sonuçları sayfası sağlanır. Bu sayfalar Google’dan engellenmezse, içerik sayfaları olmamalarına rağmen dizine eklenirler. İçerik değeri olmayan bu sayfalar, sıralamadaki iyi durumunuzu zayıflatabilir.
Örneğin yalnızca beş sayfa içeren bir web siteniz olduğunu ve bu haliyle kullanıcıların ihtiyaçlarını karşıladıklarını varsayalım. Herhangi bir kullanıcınız web sitenizde bir arama gerçekleştirdiğinde, yukarıda da bahsettiğimiz gibi bir arama sonucu sayfası oluşacaktır. Her kullanıcı için ayrı ayrı oluşan bu sayfalar Google’dan engellenmezse; beş sayfası olan web siteniz, Google açısından bin sayfalık bir web sitesi haline gelecektir.
Bu durum engellenmedikçe; Google konunuza odaklanan beş sayfalık bir web sitesi yerine; çok fazla gereksiz şeye odaklanan bin sayfalık bir web siteniz olduğunuzu düşünecek. Sonucunda da Google sitenizi çok değerli görmediğinden; daha düşük sıralamalara uygun görecek.
Bu durum da şunu gösteriyor ki; sitenizin Google için kaliteli beş sayfaya sahip olması, boş içerikli on bin sayfanın trafik çekmesinden daha iyidir.
Sitenizin her sayfası iyi olmalıdır. Sayfalarınız iyi bir içeriğe sahip olmayacaksa; sitenizde ya da Google’da yer almasının da bir anlamı yoktur.
Arama Sonucu Sayfaları Kimler İçin Faydalıdır?
Bir arama sonucu sayfası, arama yapan bir kişi için mükemmeldir. Ancak diğer kişiler için yararlı değildir. Bu nedenle, arama sonuçları Google’dan engellenmelidir. Sadece tek bir kişiye faydası olan bir sayfanın; arama motorları tarafından görülmesi büyük bir gereksizliktir.
Bloke Edilecek Sayfaları Belirleme
Arama sonucu sayfaları; birçok web sitesinde engellenecek tek sayfa tipi değildir. Çoğu zaman bir web sitesi; otomatik olarak oluşturulmuş ve ayrıca engellenmesi gereken sayfalara sahip olabilir.
Web siteleri benzersiz içerik sağlamadığı veya sağlayamadığı için Google’da kötü sıralamalarda çıkmaları sıklıkla görülen bir durumdur. Bu nedenle web sitelerinin birbirinin kopyası olan ve tamamen benzersiz olmayan sayfalarını engellemek mantıklıdır.
Engellenmesi gereken diğer bir özel içerik örneği; bağlı veri tabanı kaynaklarından veya sizin tarafınızdan gelmeyen ancak sizin için başka kaynaklardan elde edilen herhangi bir bilgiden oluşturulmuş olan sayfalardır.
Google yararlı içeriğe sahip olmayan sayfaları dizine eklerken veya sıralama yaparken; bu sayfaların hiçbir değerinin olmadığını görür. Kullanıcılar diğer web sayfalarıyla aynı bilgileri içeren sayfalara gitmekten nefret eder, bu nedenle Google da bu sayfalara olumsuz bakar.
Sayfaları Robots.txt Aracılığıyla Nasıl Engelleyebilirim?
Google web yöneticisi bize web sunucusundaki robots.txt dosyasının kullanılmasını söyler. Dosyayla sayfaları engellemek birkaç şekilde yapılabilir. Bir robots.txt dosyasının nasıl çalıştığını biliyorsanız izlemeniz gereken yol şudur;
- Klasörleri engelleme – İçeriği engellemenin en basit yolu klasöre göre engellemedir. Engellemek istediğiniz içeriğiniz varsa, bir klasöre yerleştirebilir ve tüm klasörü engelleyebilirsiniz. Örnek: Disallow: / searchresults /
- Joker karakterler – Engellenmesini istediğiniz arama sonuçlarınızın veya diğer içeriğinizin tümü dinamik olarak oluşturulmuşsa, sonuçlar “?” şeklinde bir soru işareti ile url’nizde yer alabilir. Web sitesinizin tamamı statik ama arama sonuçlarını veya araç sonuçlarını dinamik olarak sunuyorsanız; bu içeriği engellemenin kolay yolu joker karakter kullanmaktır. Örnek: Disallow: / *? *
Serdar Güven
robots.txt dosyası gerçekten seo açısından bulunmaz bir nimetmiş bunu anlıyorum birçok makalenizde birçok konunun çözümünde hep bu dosya çıkıyor. Bizde kullanıyoruz ama bu kadar derinlemesine bilgimiz olmadığı kesin.
Optimist Hub Team
Sürekli güncel kalmak adına, farklı kaynaklardan ileri okumak yapmanızı tavsiye ederiz.
Geri bildirimleriniz için teşekkürler. Sevgiler.
Hakan duman
Robot.txt in bu konularda en sagliklisi olduhunu düşünüyorum. Tek satır ile konuyu kapatmak.
Optimist Hub Team
Teşekkürler Hakan. Sevgiler.
suat
onlarca alternatif arasından kendi sitemizin fark yarattığını düşünürüz ama robot.txt ayrıntısını gözden kaçırmamak gerekir. Öne çıkmak için bulunmaz niğmet. Bilgilendirici yazı için teşekkür ederim.
Optimist Hub Team
Değerli yorumlarınızı paylaştığınız için biz teşekkür ederiz. Robot.txt ile alakalı detaylı bilgi almak isterseniz https://www.optimisthub.com/robot-txt-dosyasi.html yazımızı da okumanızı öneririz.
Ferid
Öncelikle belirtmek isterim ki, siteniz Türkiyede 3 kaliteli bilgi veren sitelerin en başında geliyor. Teşekkür ediyorum böyle değerli bilgiler için, Size Sorum olacaktır.
Google site:siteismi.com yazıb indekslenen sayfaları görmek istediyimde, url: page/1 page/2 gibi listelemeden kaynaklı sayfaların indekslendiyini görüyorum. Buda dublicate meta ve başlık problemi çıkarıyor. Böyle sayfaların indekslenmemesi için, robots txt dosyasında ekleyeceyimiz bir kod var mı ?
Çünki herdefasında o tür sayfaları url kaldır aracından kaldırmak sıkıcı.
Optimist Hub Team
Selamlar Ferid;
Google her ne kadar resmi blog’undaki açıklamasında bunu çok da önemsemediğini belirtmiş olsa da, robots.txt dosyasına Disallow: /page/* komutunu eklemenizde yarar var.
Sitenizin CMS’i WordPress ise kullandığınız All In One SEO Pack veya YOAST gibi SEO eklentilerinde bu durumla ilgili ileri seviye ayarlarda çözüm bulabilir ya da bir yazılımcı desteği ile kaynak koddan gerekli no index no follow komutunu ekletebilirsiniz.
Geri bildirimleriniz için teşekkürler.
Umarım faydalı olur.