检查RSS条目以获取新条目的可靠方法是什么?

时间:2009-10-01 05:22:11

标签: rss updates detect feeds atom-feed

我正在构建的应用程序的一部分需要检查RSS源以获取更新。我正在寻找一种可靠的方法来了解Feed是否有新条目。

我知道有时人们会为未来发布帖子,之后会发布到当前时间,这可能导致某些条目被隐藏。似乎还有更复杂的问题。我也知道,对标题或内容进行散列会导致性能不佳和结果不可靠,因为这些内容可能会发生变化而不是新条目的标志。我知道几年前,当我手动维护播客RSS源时,我从未更改过该项目。

因此,我需要一些方法可靠地检查新条目的RSS,Atom等提要,因为它们已经过检查。

具体来说,这个应用程序将使用Universal Feed Parser用Python for Google App Engine编写,但我怀疑在这种情况下这个问题太重要了。

2 个答案:

答案 0 :(得分:1)

您可以通过在http请求中添加if-modified-since标头来使用条件获取。如果没有变化,表现良好的服务器将返回304未修改。

答案 1 :(得分:1)

Feed项目具有唯一ID和/或可能唯一的网址。只对那些人进行哈希,以便快速合理地检测变化。但绝对确定的唯一方法就是像你说的那样散列内容。