質問

私のRSSリーダーアプリケーションにDjango-yarrを使用しています。RSS URLからコンテンツを取得してデータベースに保存する方法はありますか? それともそれができるライブラリーはありますか?

事前感あり

役に立ちましたか?

解決

あなたはRSSからデータを読み、それを処理してそれを保存することを探していますか?

要求データを取得します。

import requests

req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string
.

feaultysoup lxml または ElementTree XMLを処理できるデータ(または類似のライブラリ)を処理する

from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)

images = soup.findAll('media:thumbnail')
.

最後にデータで欲しいものは何でもする

for image in images:
    thing = DjangoModelThing()
    thing.image = image.attrs.get('url')
    thing.save()
.

更新

代替として、RSS

から各記事をつかむことができます。
articles = soup.findAll('item')

for article in articles:
    title = article.find('title')
    description = article.find('description')
    link = article.find('link')
    images = article.find('media:thumbnail')
.

ライセンス: CC-BY-SA帰属
所属していません StackOverflow
scroll top