Question

我正在使用feedparser从某个RSS站点获取一些信息（例如此站点 - “http://www.huxiu.com/rss/1.xml”）。

import feedparser

url = 'http://www.huxiu.com/rss/1.xml'
d = feedparser.parse(url)

entries = d.entries
print len(entries)

此印刷品8.这意味着我只从该网站获取8条新闻问题是如何从这个网站获得更多新闻？我可以设置获取新闻的号码，例如从该站点获得20条新闻吗？感谢~~~~~

Answer 1

在给定时间，您通常无法获得超过Feed中的内容。但是，如果您订阅了Feed并将其保留在系统中足够长的时间，那么随着时间的推移，您将能够获得越来越多的数据。

Answer 2

不，你不能。从网站提供商定义获取的新闻的数量。您必须每天解析RSS并每次检查新内容。您无权访问提供商提供访问权限的旧内容。

Answer 3

我们目前正在构建一个服务/ API来从任何网站获取数据。订阅beta测试：http://textract.me/