Pergunta

Estou usando Django-yarr para meus aplicativos de leitura de RSS.Existe alguma maneira de buscar conteúdo do URL RSS e salvar no banco de dados?Ou existe alguma biblioteca que possa fazer isso?

desde já, obrigado

Foi útil?

Solução

Você deseja ler dados de um RSS, processá-los e salvá-los?

Usar solicitações de para buscar os dados.

import requests

req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string

LindaSopa, lxml ou ElementoÁrvore para processar os dados (ou bibliotecas semelhantes que podem processar xml)

from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)

images = soup.findAll('media:thumbnail')

Finalmente faça o que quiser com os dados

for image in images:
    thing = DjangoModelThing()
    thing.image = image.attrs.get('url')
    thing.save()

ATUALIZAR

Alternativamente, você pode pegar cada artigo do RSS

articles = soup.findAll('item')

for article in articles:
    title = article.find('title')
    description = article.find('description')
    link = article.find('link')
    images = article.find('media:thumbnail')
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow
scroll top