Obtenha conteúdo e imagem do URL RSS em Django-yarr
-
21-12-2019 - |
Pergunta
Estou usando Django-yarr para meus aplicativos de leitura de RSS.Existe alguma maneira de buscar conteúdo do URL RSS e salvar no banco de dados?Ou existe alguma biblioteca que possa fazer isso?
desde já, obrigado
Solução
Você deseja ler dados de um RSS, processá-los e salvá-los?
Usar solicitações de para buscar os dados.
import requests
req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string
LindaSopa, lxml ou ElementoÁrvore para processar os dados (ou bibliotecas semelhantes que podem processar xml)
from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)
images = soup.findAll('media:thumbnail')
Finalmente faça o que quiser com os dados
for image in images:
thing = DjangoModelThing()
thing.image = image.attrs.get('url')
thing.save()
ATUALIZAR
Alternativamente, você pode pegar cada artigo do RSS
articles = soup.findAll('item')
for article in articles:
title = article.find('title')
description = article.find('description')
link = article.find('link')
images = article.find('media:thumbnail')
Licenciado em: CC-BY-SA com atribuição
Não afiliado a StackOverflow