Frage

Ich brauche einen IFilter für Microsoft Search Server 2008 zu entwickeln, die Berechnungen verlängert führt Text zu extrahieren. Extrahieren von Text aus einer Datei kann von 5 Sekunden bis 12 Stunden dauern. Wie kann ich desing eine solche IFilter so dass der Daemon nicht auf Timeout nicht zurück und kann auch andere IFiltern auf Timeout zurückgesetzt werden, wenn sie auflegen?

War es hilfreich?

Lösung

12 Stunden wow!

Wenn es so lange dauert, und es gibt viele Dateien, die beste Wahl wäre, eine Vorverarbeitung Anwendung zu erstellen, die den Text extrahieren würden und es für die iFilter des Zugriff zur Verfügung stellen.

Eine andere Möglichkeit wäre, html Zusammenfassungen der Dokumente zu erstellen und den Crawler indizieren diejenigen anweisen. Wenn die Übersichtsseite leicht auf das Dokument selbst, wenn nötig in Verbindung bringen könnte.

Andere Tipps

Ich habe eigentlich keine Filter entwickelt noch, so dass ich im Grunde nur raten, aber die Art, wie ich es immer Dinge zu verstehen, dass die IFilter Brocken Basis für genau diesen Grund ist. Es liegt an der Filterimplementierung um sicherzustellen, dass die zurückgegebenen Brocken „klein genug“ sind, so dass der anruf Suche Daemon einfach zwischen zwei Stücken beenden kann, wenn die Dinge zu lange dauert.

Offenbar meine Annahme falsch ist, oder würden Sie nicht diese Frage fragen.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top