Pergunta

Eu estou tentando obter as datas de entradas em dois feeds RSS diferentes através feedparser .

Aqui está o que eu estou fazendo:

import feedparser as fp
reddit = fp.parse("http://www.reddit.com/.rss")
cc = fp.parse("http://contentconsumer.com/feed")
print reddit.entries[0].date
print cc.entries[0].date

E aqui está como eles saem:

2008-10-21T22:23:28.033841+00:00

Wed, 15 Oct 2008 10:06:10 +0000

Eu quero chegar ao ponto onde eu posso descobrir qual é mais recente facilmente.

Eu tentei usar o módulo datetime do Python e busca através da documentação feedparser, mas não posso passar por este problema. Qualquer ajuda seria muito apreciada.

Foi útil?

Solução

Análise de datas é uma dor com feeds RSS in-the-wild, e é aí que feedparser pode ser uma grande ajuda.

Se você usar as propriedades *_parsed (como updated_parsed), feedparser terá feito o trabalho e vai voltar a 9 tupla data Python em UTC.

Consulte http://packages.python.org/feedparser/date-parsing. html para detalhes mais sangrentos.

Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top