以下输出:
import feedparser
d = feedparser.parse('http://www.netflix.com/NewWatchInstantlyRSS')
d.entries[177].keys()
是:
['summary_detail', 'links', 'title', 'summary', 'guidislink', 'title_detail', 'link', 'id']
根据http://feedparser.org/docs/common-rss-elements.html,条目中应该有一个“日期”元素。
一条线索或许是当我在Firefox或Safari(在Mac OS X上)上打开http://www.netflix.com/NewWatchInstantlyRSS时,我看不到任何日期。 (实际上,Safari会在每个元素旁边显示我打开Feed的日期和时间。)但Google Reader会以某种方式获取每个元素的唯一日期。 (这就是我选择上面第177条的原因 - 这是'Dare'的索引,这是今天的第一个条目,根据谷歌阅读器,它旁边显示“上午8:32”。)
有什么我不了解RSS吗?我错过了某种带日期的交叉引用Feed吗?我已经梳理了Feed中的所有条目和几个条目,并且看不到任何可能指向不同URL或任何日期的内容。
答案 0 :(得分:1)
如果您在http://www.netflix.com/NewWatchInstantlyRSS查看RSS源的原始来源(在Web浏览器中打开并查看源代码),您将看到它们未包含日期元素。应该是,但没有。
编辑:对不起,我没有完全阅读你的问题。我不知道谷歌在哪里获得它的价值。我把饲料放在google中,我得到的是10:32 AM今天对于Dare而言,无论时区是什么,都不等于你的。我会说他们自己的缓存是什么时候他们检索更新的饲料,也许他们有不同的服务器来解释我们的差异。RSS源没有特殊的属性来获取这个值,当它不存在时。如果你需要它。我建议使用类似于我认为Google正在使用的方法。