我在我的RSS阅读器应用程序中使用django-yarr。有没有办法从rss url获取内容并保存在数据库中? 或者是否有任何图书馆可以做到这一点?
提前致谢
答案 0 :(得分:3)
您是否希望从RSS中读取数据,处理并保存?
使用Requests获取数据。
import requests
req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string
BeautifulSoup,lxml或ElementTree来处理数据(或可以处理xml的类似库)
from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)
images = soup.findAll('media:thumbnail')
最后用数据做任何你想做的事情
for image in images:
thing = DjangoModelThing()
thing.image = image.attrs.get('url')
thing.save()
<强>更新强>
或者你可以从RSS获取每篇文章
articles = soup.findAll('item')
for article in articles:
title = article.find('title')
description = article.find('description')
link = article.find('link')
images = article.find('media:thumbnail')