Analisando diferentes formatos de data de feedparser em python?
-
03-07-2019 - |
Pergunta
Eu estou tentando obter as datas de entradas em dois feeds RSS diferentes através feedparser .
Aqui está o que eu estou fazendo:
import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date
E aqui está como eles saem:
2008-10-21T22:23:28.033841+00:00
Wed, 15 Oct 2008 10:06:10 +0000
Eu quero chegar ao ponto onde eu posso descobrir qual é mais recente facilmente.
Eu tentei usar o módulo datetime do Python e busca através da documentação feedparser, mas não posso passar por este problema. Qualquer ajuda seria muito apreciada.
Solução
Análise de datas é uma dor com feeds RSS in-the-wild, e é aí que feedparser
pode ser uma grande ajuda.
Se você usar as propriedades *_parsed
(como updated_parsed
), feedparser
terá feito o trabalho e vai voltar a 9 tupla data Python em UTC.
Consulte http://packages.python.org/feedparser/date-parsing. html para detalhes mais sangrentos.