我正在使用feedparser从某个RSS站点获取一些信息(例如此站点 - “http://www.huxiu.com/rss/1.xml”)。
import feedparser
url = 'http://www.huxiu.com/rss/1.xml'
d = feedparser.parse(url)
entries = d.entries
print len(entries)
此印刷品8.这意味着我只从该网站获取8条新闻 问题是如何从这个网站获得更多新闻?我可以设置获取新闻的号码,例如从该站点获得20条新闻吗? 感谢~~~~~
答案 0 :(得分:2)
在给定时间,您通常无法获得超过Feed中的内容。但是,如果您订阅了Feed并将其保留在系统中足够长的时间,那么随着时间的推移,您将能够获得越来越多的数据。
答案 1 :(得分:0)
不,你不能。从网站提供商定义获取的新闻的数量。您必须每天解析RSS并每次检查新内容。您无权访问提供商提供访问权限的旧内容。
答案 2 :(得分:0)
我们目前正在构建一个服务/ API来从任何网站获取数据。订阅beta测试:http://textract.me/