使用Python定期获取Rss feed

时间:2014-12-14 01:24:47

标签: python rss feedparser

我正在尝试构建一个获取rss项的算法。我可以使用feedparser来做到这一点。但是,我无法获得更新项目。

当我执行代码时

data = feedparser.parse(URL)

我想自动执行此操作,而不是每次都运行脚本

for x in data
// Check if the entries is new 
   if x.link not in data["links"]: 
   // storing the data. 

我虽然使用Timer所以我保持脚本在服务器上运行,并且每隔一小时运行一次。

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

如果我理解了这个问题,那么您就是要设置一个cron作业。你不希望你的程序一直在服务器上运行,程序内部运行一个计时器。相反,作为服务在服务器上运行的cron守护程序具有计时器,您可以计划何时运行程序以及找到程序的位置。在Unix,Linux等上,您正在寻找cron。在Mac上,您可以使用cron,但显然首选的类似内置工具是启动的。在Windows上,您需要Windows Scheduler。所有这些基本上都是一样的。要运行的程序和计划信息保存在表格文件中,但是上面提到的每个工具都有gui工具可以帮助您,因此您不必使用crontab或类似的语法。您可以谷歌中的任何一个,具体取决于您的服务器运行的操作系统。