Django-yarrのRSS URLからコンテンツとイメージを取得する
-
21-12-2019 - |
質問
私のRSSリーダーアプリケーションにDjango-yarrを使用しています。RSS URLからコンテンツを取得してデータベースに保存する方法はありますか? それともそれができるライブラリーはありますか?
事前感あり
解決
あなたはRSSからデータを読み、それを処理してそれを保存することを探していますか?
要求データを取得します。
import requests
req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string
.
feaultysoup 、 lxml または ElementTree XMLを処理できるデータ(または類似のライブラリ)を処理する
from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)
images = soup.findAll('media:thumbnail')
.
for image in images:
thing = DjangoModelThing()
thing.image = image.attrs.get('url')
thing.save()
.
から各記事をつかむことができます。
articles = soup.findAll('item')
for article in articles:
title = article.find('title')
description = article.find('description')
link = article.find('link')
images = article.find('media:thumbnail')
. 所属していません StackOverflow