Pregunta

Parte de una aplicación que estoy creando necesita verificar las fuentes RSS en busca de actualizaciones.Estoy buscando una forma confiable de saber si un feed tiene nuevas entradas.

Sé que a veces las personas hacen publicaciones en el futuro y, después, publicaciones en el presente, lo que podría provocar que algunas entradas se oculten.Parece que también podría haber más complicaciones que eso.También sé que aplicar hash al título o al contenido daría como resultado un rendimiento deficiente y resultados poco confiables, ya que pueden cambiar y no son una señal de nuevas entradas.Y sé que hace unos años, cuando mantenía manualmente una fuente RSS de podcast, nunca cambié el elemento.

Por lo tanto, necesito alguna forma de verificar de manera confiable los feeds RSS, Atom, etc. en busca de nuevas entradas desde que se verificaron por última vez.

Específicamente, esta aplicación se escribirá en Python para Google App Engine usando Analizador de feeds universal, pero dudo que eso importe demasiado en este caso.

¿Fue útil?

Solución

Puede utilizar un GET condicional mediante la adición de un If-Modified-Since encabezado a su petición http. Bien servidores portaron devolverá un 304 sin modificar si no hay cambios.

Otros consejos

artículos de alimentación tienen un identificador único y / o una dirección URL que es probable que sea único. Hash sólo aquellos en conjunto para obtener una forma rápida y razonable para detectar cambios. Pero la única manera de estar absolutamente seguro que sería para discutir el contenido como usted ha dicho.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top