Frage

Wir sind mit dem Google CSE (Custom Search Engine) kostenpflichtigen Service zum Indizieren von Inhalten auf unserer Website. Die Website wird von meist PHP-Seiten gebaut, die mit Include-Dateien zusammengebaut werden, aber es gibt einige dynamischen Seiten, dass Pull-Informationen aus einer Datenbank in eine einzige Seitenvorlage (neue Versionen zum Beispiel). Das Problem, das wir haben, ist ich festlegen ein Datum auf dem Inhalt in der Datenbank so sagen „id = 2“ a „Dieser Inhalt ist abgelaufen“ notice bringen auslaufen werden. Wenn jedoch ID 2 hatte eine hochgeladenes PDF beigefügt, um es, die PDF-Datei bleibt im Suchindex.

Ich weiß, ich könnte ein Cleanup-Skript schreiben und cron ausgeführt haben, dass Blicke auf den db, findet abgelaufen Inhalt, überprüft, ob alle hochgeladenen Dateien angehängt wurden und entweder Umbenennungen oder entfernt sie, aber es hat eine bessere Lösung sein (hoffe ich).

Bitte lassen Sie mich wissen, wenn Sie dies in der Vergangenheit aufgetreten sind, und was Sie vorschlagen.

Danke, D.

War es hilfreich?

Lösung 2

Was wir am Ende tun war eine Überprüfung Skript zum Upload-Skript zu binden, dass, sobald er den aktuellen Upload abgeschlossen ist, alte Dateien gelöscht „unverbundene“ und die DB Aufzeichnungen wurden waren.

Für uns sind dies funktioniert, weil es ist eine Art einer „add one / Entfernen einer“ Situation, wo wir eine bestimmte Anzahl von von Elementen wollen in einer Walz um erscheinen.

Andere Tipps

Es gibt leider keine Möglichkeit, eine klare Antwort zu dieser Zeit zu geben. Wir haben keine Kenntnis davon, wie Sie Ihre PDF-Dateien sind „angebracht“, um Ihre Seiten oder wie Sie Ihre DB strukturiert ist,

Die beste Lösung wäre, eine robots.txt-Datei zu erstellen, dass Blöcke, die URLs für die einzelnen PDF-Dateien, die Sie entfernen möchten. Google wird sie aus dem Index auf seinem nächsten Durchgang (in der Regel in etwa eine Stunde) fallen.

http://www.robotstxt.org/

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top