Pregunta

Estoy tratando de obtener las fechas de las entradas en dos fuentes RSS diferentes a través de feedparser .

Esto es lo que estoy haciendo:

import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date

Y así es como salen:

2008-10-21T22:23:28.033841+00:00

Wed, 15 Oct 2008 10:06:10 +0000

Quiero llegar al punto en el que pueda descubrir cuál es más nuevo fácilmente.

He intentado usar el módulo datetime de Python y buscar en la documentación de feedparser, pero no puedo superar este problema. Cualquier ayuda sería muy apreciada.

¿Fue útil?

Solución

El análisis de fechas es un problema con los feeds RSS en el mundo salvaje, y ahí es donde feedparser puede ser de gran ayuda.

Si usa las propiedades * _parsed (como updated_parsed ), feedparser habrá hecho el trabajo y devolverá un Python de 9 tuplas fecha en UTC.

Consulte http://packages.python.org/feedparser/date-parsing. html para más detalles sangrientos.

Licenciado bajo: CC-BY-SA con atribución
No afiliado a StackOverflow
scroll top