Gibt es eine Möglichkeit Googlebot indiziert bestimmte Teile einer Seite zu verhindern?

https://stackoverflow.com/questions/1497445

19-09-2019
|

Frage

Ist es möglich, Richtlinien zu Google zur Feinabstimmung in einem solchen Ausmaß, dass sie Teil einer Seite ignoriert, aber dennoch Index der Rest?

Es gibt ein paar verschiedene Themen, die wir gekommen sind, über die durch diese, wie geholfen werden würde:

RSS-Feed / Newsticker-Typ Text auf einer Seite Inhalt von einer externen Quelle Anzeige
Benutzer Eingabe Kontakt Telefon usw. Details, die sie sichtbar auf der Website wollen aber lieber sie nicht google-able

Ich bin mir bewusst, dass beide die oben über andere Techniken (wie zum Beispiel das Schreiben der Inhalte mit JavaScript) angesprochen werden, aber frage mich, ob jemand weiß, ob es eine sauberere Option ist bereits von Google?

Ich habe einige graben auf diese Weise und stieß auf Erwähnungen von googleon und googleoff Tags , aber diese scheinen exklusiv für Google Search Appliances zu sein.

Wer weiß, ob es ein ähnlicher Satz von Tags ist, an den Googlebot haftet?

Bearbeiten : Nur um zu klären, ich will nicht die gefährliche Route von Cloaking gehen / Portion unterschiedliche Inhalte bei Google nach oben, weshalb ich bin auf der Suche, um zu sehen, ob es ein Thema " legit“Art und Weise zu erreichen, was ich möchte hier tun.

Lösung

, was Sie fragen, kann nicht wirklich geschehen, Google, entweder die gesamte Seite, oder nichts davon.

Sie könnten einige hinterhältige Tricks obwohl wie der Teil der Seite fügen Sie in einem iFrame indiziert werden sollen und robots.txt nicht nicht zu fragen verwenden Google indizieren, dass iFrame.

Andere Tipps

Kurz NO -. Es sei denn, Sie verwenden Cloaking mit von Google abgeraten

Bitte beachten Sie auch die offizielle Dokumentation von hier

http://code.google.com/apis/ searchappliance / Dokumentation / 46 / admin_crawl / Preparing.html

Gehen Sie zum Abschnitt "Ausschließen unerwünschter Text aus dem Index"

<!--googleoff: index-->
here will be skipped
<!--googleon: index-->

Gefunden nützliche Ressource für die Verwendung von bestimmten doppelten Inhalt und nicht Index für diese Inhalte durch Suchmaschinen zu ermöglichen.

<p>This is normal (X)HTML content that will be indexed by Google.</p>

<!--googleoff: index-->

<p>This (X)HTML content will NOT be indexed by Google.</p>

<!--googleon: index>

Auf dem Server die Suche bietet von IP mit PHP oder ASP erkennen. Dann füttern die IP-Adressen, die in dieser Liste fallen eine Version der Seite, die Sie indiziert werden soll. In dieser Suchmaschine Version Ihrer Seite verwenden, um den Tag-kanonischen Link auf die Suchmaschine indiziert werden die Version der Seite, die Sie nicht wollen, angeben.

Auf diese Weise wird die Seite mit dem Inhalt, der Index nur nach Adresse indiziert wird sein wollen, während der nur die Inhalte, die Sie indiziert werden wollen indiziert werden. Diese Methode werden Sie nicht von der Suchmaschinen blockiert werden und sind völlig sicher.

Ja auf jeden Fall können Sie Google stoppen Indizierung einige Teile Ihrer Website durch individuelle robots.txt erstellen und schreiben, welche Teile Sie wollen nicht wie wpadmins zu indizieren, oder einen bestimmten Beitrag oder eine Seite, so dass Sie so leicht, indem tun können diese Datei robots.txt .before zum Beispiel www.yoursite.com/robots.txt überprüfen Sie Ihre Website robots.txt zu schaffen.

All Suchmaschinen entweder Index oder die gesamte Seite ignorieren. Die einzige Möglichkeit, das umzusetzen, was Sie wollen, ist zu:

(a) zwei verschiedene Versionen der gleichen Seite

(b) erkennt den Browser verwendet

diesen Link könnte hilfreich sein.

Es gibt Meta-Tags für Bots und es gibt auch die robots.txt, mit dem Sie den Zugriff auf bestimmte Verzeichnisse beschränken können.

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow