如何使用feedparser从RSS站点解析更多信息?

时间:2014-01-17 09:54:54

标签: python rss feedparser

我正在使用feedparser从某个RSS站点获取一些信息(例如此站点 - “http://www.huxiu.com/rss/1.xml”)。

import feedparser

url = 'http://www.huxiu.com/rss/1.xml'
d = feedparser.parse(url)

entries = d.entries
print len(entries)

此印刷品8.这意味着我只从该网站获取8条新闻 问题是如何从这个网站获得更多新闻?我可以设置获取新闻的号码,例如从该站点获得20条新闻吗? 感谢~~~~~

3 个答案:

答案 0 :(得分:2)

在给定时间,您通常无法获得超过Feed中的内容。但是,如果您订阅了Feed并将其保留在系统中足够长的时间,那么随着时间的推移,您将能够获得越来越多的数据。

答案 1 :(得分:0)

不,你不能。从网站提供商定义获取的新闻的数量。您必须每天解析RSS并每次检查新内容。您无权访问提供商提供访问权限的旧内容。

答案 2 :(得分:0)

我们目前正在构建一个服务/ API来从任何网站获取数据。订阅beta测试:http://textract.me/