Frage

Ich verwende SharePoint Server 2007 unter Windows Server 2008. Ich verwende das Suchzentrum, um die Webdatenquelle zu kriechen (dh Crawl -Webseite von anderen Websites). Meine Frage bezieht sich auf krabble Seitenzähler, die für die Webdaten -Quellprotokollseite des Suchzentrums angezeigt werden.

Meine Frage ist, dass 3 Crawl -Zähler, erfolgreicher Zähler, Ausfallzähler und Warnzähler angezeigt werden. Wird es für jeden Zählerwert eine Duplikations -URLs geben? Zum Beispiel wird es für Webdatenquelle www.mysit..com gemeldet, 1000 werden erfolgreich gekrabbt, 10 fehlgeschlagen, keine Warnung. Bedeutet das, dass im Suchzentrum 1000 verschiedene Webseiten gespeichert sind? Ich bin mir nicht sicher, ob es in den 1000 gezählten Seiten doppelte URLs gibt?

Übrigens: Ich habe diese Verwirrung, weil ich zum Beispiel das tägliche inkrementelle Seitenkriechen festgelegt habe, wenn http://www.mysite.com/1.html Ist Crawlered sowohl gestern als auch heute (beide Fälle sind erfolgreich Crawl), wird es zweimal gezählt? Schätzen Sie, ob jemand einige Dokumente darüber angeben könnte, was die Bedeutung der Theaterstücke bedeutet?

Danke im Voraus, George

War es hilfreich?

Lösung

Wenn Sie eine reguläre Website kriechen, folgt sie jedem der Links. Es sollte keine Seiten duplizieren, aber es wird den Hinweis auf die Startseite zum Beispiel viele Male sehen. Letztendlich würden Sie die Anzahl der Seiten oder Elemente bestimmen, indem Sie sich die Elemente in der Indexzahl ansehen, nicht die Anzahl der gekrabbten Elemente.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit sharepoint.stackexchange
scroll top