Frage

Teil einer App Ich bin Gebäude muss RSS-Feeds nach Updates suchen. Ich bin auf der Suche nach einem zuverlässigen Weg zu wissen, ob ein Feed neue Einträge.

Ich weiß, dass die Leute manchmal Beiträge für die Zukunft zu machen und danach, Beiträge in die heutige Zeit, die einige Einträge ausgeblendet werden dazu führen könnten. Es scheint, wie es könnte mehr Komplikationen als das, als gut. Ich weiß auch, dass der Titel oder Inhalt Hashing einer schlechten Leistung und unzuverlässigen Ergebnissen da diese zur Folge hätte verändern können und sind kein Zeichen für neue Einträge. Und ich weiß, dass vor ein paar Jahren, als ich einen Podcast RSS-Feed manuell beibehalten ich nie das Element geändert.

Also, ich brauche einen Weg, um zuverlässig RSS zu überprüfen, Atom, etc Feeds für neue Einträge, da sie geprüft wurden gedauert.

Im Einzelnen wird diese Anwendung in Python für Google App Engine geschrieben werden mit Universal-Feed-Parser , aber ich Zweifel, dass zu viel in diesem Fall von Bedeutung ist.

War es hilfreich?

Lösung

Sie können eine bedingte get verwenden, indem eine Zugabe If-Modified-Since Header auf Ihre HTTP-Anfrage. Gut erzogene Server eine 304 unmodifizierten zurück, wenn es keine Änderungen.

Andere Tipps

Feed-Elemente haben eine eindeutige ID und / oder eine URL, die einzigartig sein dürfte. Hash nur zusammen diejenigen, die eine schnelle und kostengünstige Art und Weise zu bekommen, um Veränderungen zu erkennen. Aber der einzige Weg, um absolut sicher zu sein, um den Inhalt zu Hash wäre wie Sie gesagt haben.

Lizenziert unter: CC-BY-SA mit Zuschreibung
Nicht verbunden mit StackOverflow
scroll top