从django-yarr的RSS url获取内容和图像

时间:2014-04-11 13:55:17

标签: django rss-reader

我在我的RSS阅读器应用程序中使用django-yarr。有没有办法从rss url获取内容并保存在数据库中? 或者是否有任何图书馆可以做到这一点?

提前致谢

1 个答案:

答案 0 :(得分:3)

您是否希望从RSS中读取数据,处理并保存?

使用Requests获取数据。

import requests

req = requests.get('http://feeds.bbci.co.uk/news/technology/rss.xml')
reg.text // XML as a string

BeautifulSouplxmlElementTree来处理数据(或可以处理xml的类似库)

from bs4 import BeautifulSoup
soup = BeautifulSoup(req.text)

images = soup.findAll('media:thumbnail')

最后用数据做任何你想做的事情

for image in images:
    thing = DjangoModelThing()
    thing.image = image.attrs.get('url')
    thing.save()

<强>更新

或者你可以从RSS获取每篇文章

articles = soup.findAll('item')

for article in articles:
    title = article.find('title')
    description = article.find('description')
    link = article.find('link')
    images = article.find('media:thumbnail')