![]() |
|||||||||
|
|||||||||
Website Optimizasyonu=Googlebot'u nasıl engellerim? Google çeşitli kullanıcı aracıları kullanır. Bir girişin User-agent satırına bot adını ekleyerek bu aracılardan istediğinize erişimi engelleyebilirsiniz. Googlebot'u engellerseniz "Googlebot" ile başlayan botların tamamı engellenir. Örneğin, Googlebot'u tamamen engellemek için aşağıdaki söz dizimini kullanabilirsiniz: Googlebot'a İzin Verme User-agent: Googlebot Googlebot, herkese yönelik olan bağlantıyı değil, kendisine yönelik olan bağlantıyı izler. İzin Ver uzantısı User-agent: Googlebot Bu girişler, dosyam.html dışında klasor1 dizinindeki tüm sayfaları engelleyebilir. Googlebot'u engelleyip başka bir Google botuna (Googlebot-Mobile gibi) izin vermek isterseniz İzin Ver kuralını kullanarak söz konusu bota erişim izni verebilirsiniz. Örneğin: User-agent: Googlebot-Mobile robots.txt dosyamı nereye yerleştirebilirim? Engellemek istediğim her dosyayı listelemek istemiyorum. Kalıp eşlemesi kullanabilir miyim? Evet, Googlebot bazı şablon eşlemelerini yorumlar. Bu, standardın genişletilmiş halidir ve tüm botlar buna uymayabilir. * karakterini kullanarak bir karakter sırasıyla eşleme Bir soru işareti (?) içeren tüm URL'lere erişimi engellemek için aşağıdaki girişi kullanabilirsiniz: $ karakterini kullanarak URL'nin bitiş karakterleriyle eşleme Bu kalıp eşlemesini, İzin Ver yönergesiyle birlikte kullanabilirsiniz. Örneğin, ? bir oturum kimliğini gösteriyorsa bu öğeleri içeren tüm URL'leri dışlayarak Googlebot'un aynı sayfaları taramasını önleyebilirsiniz. Ancak ? ile biten URL'ler, eklenmesini istediğiniz sayfanın sürümü olabilir. Bu durumda, robots.txt dosyanızı aşağıda gösterildiği biçimde ayarlayabilirsiniz: Disallow:/ *? satırı, ? içeren URL'lerin tümünü engeller (daha açık belirtmek gerekirse, alanınızla başlayan ve ardından herhangi bir dize, bir soru işareti ve herhangi bir dize gelen URL'lerin tümünü engeller). Allow: /*?$ satırı ? ile biten tüm URL'lere izin verir (daha açık belirtmek gerekirse, alanınızla başlayan ve ardından bir dize ve bir ? gelen ve ? işaretinden sonra hiç karakter içermeyen URL'lerin tümüne izin verir). robots.txt hataları tarafından kısıtlanan URL'ler nedir? Google, bir robots.txt kısıtlaması nedeniyle URL'yi tarayamadı. Bu bir dizi nedenden dolayı olabilir. Örneğin robots.txt dosyanız Googlebot'u tamamen engelleyebilir; bu URL'nin yer aldığı dizine erişimi engelleyebilir ya da özellikle bu URL'ye erişimi engelleyebilir. Genellikle bu bir hata değildir. Bu URL'yi taramamızı önlemek için özel olarak ayarlanmış bir robots.txt dosyanız olabilir. Durum buysa düzeltilmesi gerekmez; bu dosya için robots.txt'yi kabul etmeye devam edeceğiz. Bir URL, robots.txt dosyası tarafından engellenen bir URL'ye yeniden yönlendirilirse, ilk URL robots.txt (URL'nin robots.txt analiz aracında İzin verilmiş olarak listelenmesine rağmen) tarafından engellenmiş olarak rapor edilir. Meta etiket kullanarak sayfaları engelleme veya kaldırma Tarayıcının sayfalara erişmesini engellemek için bir robots.txt dosyası kullanmak yerine robotlara sayfayı dizine eklememe komutunu vermek için HTML sayfasına bir <META> etiketi ekleyebilirsiniz. Bu standart, http://www.robotstxt.org/wc/exclusion.html#meta adresinde (İngilizce) açıklanmaktadır. Sitenizdeki bir sayfanın hiçbir robot tarafından dizine eklenmemesi için aşağıdaki meta etiketi sayfanızın <HEAD> kısmına yerleştirmeniz gerekir: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW"> Sitenizdeki bir sayfanın diğer robotlar tarafından dizine eklenmesine izin verip yalnızca Google'ın robotlarını engellemek istiyorsanız aşağıdaki meta etiketi kullanmanız gerekir: <META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW"> Robotların sitenizdeki sayfayı dizine eklemesine izin verip giden bağlantıları izlememe talimatı vermek için aşağıdaki meta etiketi kullanmanız gerekir: <META NAME="ROBOTS" CONTENT="NOFOLLOW"> Robotların sitenizdeki sayfayı dizine eklemesine izin verip söz konusu sayfadaki resimleri dizine eklememe talimatı vermek için aşağıdaki meta etiketi kullanmanız gerekir: <META NAME="ROBOTS" CONTENT="NOIMAGEINDEX"> robots.txt dosyamın beklenen şekilde çalışıp çalışmadığını nasıl denetlerim? robots.txt analiz aracı, robots.txt dosyasını Googlebot'un okuduğu gibi okur. Araç bir satırda söz dizimi hatası belirlerse Googlebot söz konusu satırı tanımayacak demektir. Araç bir URL'ye izin verildiğini gösterirse, Googlebot da o URL'yi izin verilmiş olarak tanıyacaktır. Bu araç sadece Google user-agent'lara yönelik (Googlebot gibi) sonuçları sunar. Diğer botlar ise robots.txt dosyasını aynı şekilde tanımayabilir. Örneğin, Googlebot standart tanımın genişletilmiş bir biçimini destekler. Allow: satırlarının yanı sıra * ve $ dize kalıbı eşlemesini de tanır. Dolayısıyla araç bu uzantıları tanındığı gibi içeren satırları gösterirken, bunun sadece Googlebot için geçerli olduğunu ve varsa sitenizi tarayan diğer botlar için geçerli olmayabileceğini unutmayın. Bir robots.txt dosyası etki alanının kök dizininde bulunuyorsa, bu araçlar Google'ın dosya hakkında edindiği aşağıdaki bilgileri listeler: |
SPONSOR LİNKLER Arama Motoru Kayıt Arama motoru Optimizasyon Arama Motoru Kayıt |
||||||||
| Sitekelime | Products | Express | Onemli| Paketler| Web Motor | Contact | Motor Kural | Referans | Kurallar | Faz.Kayit | Not:Genel ahlaka aykiri web sitelerinin kaydi yapilmamaktadir |
|||||||||
|
|||||||||
Bu
site 09 Ocak 2008 de guncellenmistir. |
|||||||||