MOSS 2007 Crawl

https://stackoverflow.com/questions/101182

01-07-2019
|

Frage

Ich versuche, kriecht zu bekommen auf zwei getrennten Farmen arbeiten Ich habe aber nicht bekommen kann es entweder auf einem zu arbeiten. Beide haben zwei WFE mit einem zusätzlichen WFE konfiguriert als Index-Server. Es gibt einen weiteren Server für den Query gewidmet und zwei geclusterten SQL 2005 Back-End-Server für die Datenbank. Ich habe mindestens 50 verschiedene Websites erfolglos versucht, die ich mit Lösungen aus einer Suchmaschine gefunden. Ich habe konfiguriert (extended) meine Web App http: // servername: 12345 als Standardzone und http://abc.companyname.com wie die individuellen und Intranet-Zonen. Wenn ich jeden von denen, die in die Inhaltsquelle eingeben und dann versuchen, einen Crawl zu laufen, bekomme ich ein paar Fehler im Crawlprotokoll:

http: // servername: 12345 zurückgibt:
„Es konnte keine Verbindung zum Server her. Bitte stellen Sie sicher, dass die Website zugänglich ist.“

http://abc.companyname.com zurückgibt:
„Gelöscht von Gathererprotokoll. (Die Startadresse oder Inhaltsquelle, die dieses Element enthalten ist, wurde gelöscht und somit wurde dieses Element gelöscht.)“

Allerdings kann ich auf beiden URLs und die Seite zugänglich ist.

Irgendwelche Ideen?

Weitere Informationen:

Ich wischte die Tafel sauber, so zu sprechen, und lief ein anderes Crawl eine aktualisierte Probe zur Verfügung zu stellen.

Meine Inhaltsquellen sind als solche:

http: // servername: 33333
http://sharepoint.portal.fake.com
SPS3: // servername: 33333

Meine aktuellen Durchforstungsprotokoll Fehler sind:

SPS3: // servername: 33333
Fehler bei PortalCrawl Web Service.

http: // servername: 33333 / mysites
Inhalt für diese URL von dem Server, weil ein nicht-Index-Attribut ist ausgeschlossen.

http: // servername: 33333 / mysites
Crawled

STS3: // servername: 33333 / contentdbid = {62a647a ...
Crawled

STS3: // servername: 33333
Crawled

http: // servername: 33333
Crawled

http://sharepoint.portal.fake.com
Der Crawler konnte nicht mit dem Server kommunizieren. Überprüfen Sie, ob der Server verfügbar ist und dass die Firewall den Zugriff korrekt konfiguriert ist.

Ich doppelt auf Tippfehler oben geprüft, und ich sehe nicht so sollte dies eine genaue Reflexion sein.

Lösung

Eine Sache zu erinnern ist, dass Sharepoint-Website kriecht unterscheiden Dateifreigaben oder nicht-Sharepoint-Websites von kriecht.

Ein paar andere schnellen Zeiger:

das SPS3: Protokoll Benutzerprofile für Personensuche für das Crawling. Sie können alles außer Acht lassen der Crawler sagt über sie, bis Sie für Benutzerprofile bereit sind.
Crawl-Konto soll den Zugriff auf Ihre gesamte Farm haben. Wenn Sie die Berechtigungen Fehler sehen, finden Sie den KB-Artikel, die Ihnen sagt, wie Sie Ihren Crawl-Konto zurückgesetzt werden (es ist ein bestimmter Befehl stsadm.exe). Wenn Sie versuchen, eine andere Farm Inhalt zu kriechen, dann werden Sie etwas anderes aus arbeiten, um Ihren Crawl-Konto Zugriff zu gewähren. Ich denke, dies ist Ihr größtes Problem ist gegenwärtig.
Der Crawler (aus dem Index Server ausgeführt wird) wird versuchen, die öffentliche URL zu besuchen. Ich habe vor Kommunikation zwischen Servern Probleme hat; sicherzustellen, dass alle drei Server gegenseitig pingen können, und sicherstellen, dass der Index-Server die öffentliche URL (offene IE auf dem Indexserver und check it out) erreichen kann. Wenn Sie Probleme haben, ist es Zeit zu schmutzig Indexserver der Hosts-Datei auf. Das ist etwas, Sharepoint für Sie tut sowieso, also nicht das Gefühl, zu schlecht, es zu tun. Wenn Sie alles eingerichtet haben, abgesehen von integrierten Windows-Authentifizierung, müssen Sie härter arbeiten Crawler zum Laufen zu bringen.

Wie auch immer, ist schon eine Menge hin und her in den Antworten, so dass ich nur ein paar Vorschläge gibt shotgunning, vielleicht einer von ihnen ist am Ziel.

Andere Tipps

Ich bin ein wenig verwirrt über Ihre Farmtopologie. Eine Maschine wie ein installiert nur WFE kann nicht ein Indexer sein. Eine Maschine installiert als „vollständig“ kann ein Indexer, Abfrage und / oder ein WFE sein ...

Auch anstelle das Standardinhaltszugriffskonto zu ändern, können Sie stattdessen eine Durchforstungsregel hinzuzufügen (wenn alles in Betrieb ist)

Können Sie sehen, ob etwas nützlich ist in dem% Common% / Microsoft Shared / Web-Server-Erweiterungen / 12 / logs auf dem Indexer?

Die Log-Datei ein bisschen ausführlicher sein kann, können Sie die Suche nach „gestartet“ oder „voll“ und das wird man in der Regel im Protokoll der Linie, wo Crawl gestartet.

Auch auf dem SQL-Maschine, können Sie in der Lage sein, mehr Informationen aus dem MSScrawlurlhistory Tisch.

Können Sie eine Inhaltsquelle erstellen für http://www.cnn.com und starten Sie einen vollständigen Crawl ? Haben Sie den gleichen Fehler (s)?

Auch wir möchten diese offline nehmen, lassen Sie mich wissen, wenn Sie das tun wollen.

Ich bin mir nicht sicher, ob es einen Weg gibt, obwohl private Nachrichten über Stackoverflow zu senden.

Die meisten Ihrer Fragen im Zusammenhang mit Kerberos zusammenhängen, es klingt. Wenn Sie nicht über die Infrastruktur Update angewendet haben, dann werden Sharepoint nicht in der Lage sein, kerberos Auth auf Web-Sites w / non default (80/443) Ports. Das ist auch, warum (ich würde wetten), dass Sie nicht CA vom Server 5 zugreifen können, wenn sie auf dem Server sind 4. Wenn Sie richtig eingerichtet nicht die SPNs, dann CA wird nur von der Maschine zugänglich sein es installiert ist. Wenn Sie Sharepoint über Port 80 als Standard-URL installiert hatte würden Sie ohne Probleme die lokale Sharepoint-Crawl tun können. Aber nach Design der lokalen Sharepoint-Sites Crawl verwendet die Standard-URL der Sharepoint-Sites zugreifen. Schauen Sie sich http://codefrob.spaces.live.com/blog/ cns! 7C69E7B2271B08F6! 363.entry für ein wenig mehr Details darüber, wie Kerberos & Sharepoint bekommen gut zusammen zu arbeiten.

In der Dienste auf dem Server Abschnitt überprüfen Sie die Eigenschaften für die Suche Crawl-Konto, um sicherzustellen, es eingerichtet ist, und dass es Berechtigungen diese Websites zuzugreifen.

Danke für den neuen Eingang!

Also habe ich von meinem Wochenende kam und ich wollte durch Ihre Zeiger gehen und jeder versuchen und dann berichten darüber, wie sie nicht funktioniert hat und dann die Ergebnisse veröffentlichen, die ich habe. Komische passiert, wenn.

Ich ging zu meinem Indexer (servername5) und ich versuchte zu Central Admin und dem Hauptportal aus dem Internet Explorer zu verbinden. Weder gearbeitet. Also ging ich in IIS auf ther Indexer zu versuchen, das Hauptportal aus IIS zu suchen. Das hat nicht funktioniert und ich erhielt einen Fehler mir zu sagen, dass etwas anderes diesen Port verwendet hat. So sah ich meine alte Website aus dem vorherigen Build und löschte ich es von IIS zusammen mit dem entsprechenden Application Pool. Dann begann ich den App-Pool für die Website mit dem neuen Build und durchsuchte auf die Website. Erfolg. Dann durchsuchte ich auf die Website vom Browser auf meinem eigenen PC. Erfolg wieder. Dann lief ich einen Crawl durch die vollständige URL, nicht die server, etwa so:

http://sharepoint.portal.fake.com

Erfolg wieder. Es kroch das gesamte Portal einschließlich der Unterseiten genau wie ich wollte. Die „Angebote im Index“ aufgefüllt schnell und ich könnte sagen, ich rolle.

Ich kann immer noch nicht die Central Admin Site auf servername4 von servername5 gehosteten zuzugreifen. Ich bin mir nicht sicher, warum nicht, aber ich weiß nicht, dass es an dieser Stelle viel zählt.

Woher kommt diese mich verlassen? Was war die Lösung?

Ich bin immer noch nicht sicher. Vielleicht war es die wieder aufzubauen. Vielleicht, sobald ich die Serverfarm umgebaut ich hatte alles, was ich brauchte, um es zu arbeiten, aber es wäre einfach nicht wegen der vorherigen Website noch in IIS arbeiten. (Es ist schon komisch, wie schlampig ein Sharepoint sein kann un-installieren. Die manuelle Löschen von Inhaltsdatenbanken, Web-Site und Anwendungspools scheinen notwendig, und das ist wahrscheinlich nicht der Fall sein.)

Auf jedem Fall, es funktioniert jetzt auf meiner „test“ Farm so dass der Schlüssel zu bekommen, ist es auf der Produktionsfarm arbeiten. Ich bin zuversichtlich, dass es nicht nach dieser Erfahrung so schwierig sein wird.

Danke für die Hilfe von allen!

Lizenziert unter: CC-BY-SA mit Zuschreibung

Nicht verbunden mit StackOverflow