Question

Une partie d'une application que je suis bâtiment doit vérifier les flux RSS pour les mises à jour. Je suis à la recherche d'un moyen fiable pour savoir si un aliment a de nouvelles entrées.

Je sais que les gens font parfois des postes à l'avenir et, après cela, les messages à l'heure actuelle, ce qui pourrait provoquer des entrées à cacher. Il semble que il pourrait y avoir plus de complications que cela, aussi bien. Je sais aussi que le titre ou le hachage contenu entraînerait une mauvaise performance et des résultats peu fiables car celles-ci peuvent changer et ne sont pas un signe de nouvelles entrées. Et je sais que quelques années il y a quand je maintenais un flux RSS podcast I manuellement jamais changé l'élément.

Alors, je besoin d'un moyen de vérifier de manière fiable RSS, Atom, etc. flux de nouvelles entrées depuis leur duraient cochés.

Plus précisément, cette demande sera écrit en Python pour Google App Engine en utilisant Universal Flux Parser , mais je doute qui compte trop dans ce cas.

Était-ce utile?

La solution

Vous pouvez utiliser un get conditionnel en ajoutant un si modifié-Since à votre demande http. Eh bien comportés serveurs renvoient un 304 non modifiée s'il n'y a pas de changements.

Autres conseils

produits d'alimentation ont un identifiant unique et / ou une URL qui est susceptible d'être unique. Hash seulement ceux ensemble pour obtenir un moyen rapide et raisonnable pour détecter les changements. Mais la seule façon d'être absolument sûr serait de hachage du contenu comme vous avez dit.

Licencié sous: CC-BY-SA avec attribution
Non affilié à StackOverflow
scroll top