使用Feedparser检索ETag属性

时间:2011-06-24 11:14:14

标签: python atom-feed

我知道Feedparser支持检索ETag标头(http://www.feedparser.org/docs/http-etag.html),但我检索的Feed包含'etag'作为内容节点中的属性,对于检索到的每个entry项:
<content type="application/json" etag="c04bada0055b8a12decd459302b2f777">{"name":"Badiou","parent":false}</content>

但是,当我解析Atom文档时,此属性似乎被丢弃:
'content': [{'base': u'', 'type': u'application/json', 'value': u'{"name":"Badiou","parent":false}', 'language': None}]

这是一个Feedparser限制,如果是这样,任何人都可以建议一种方法来检索它,还是只需要将Atom doc解析为XML?

1 个答案:

答案 0 :(得分:1)

Atom和RSS是标准,预计标准将以预定义的方式实施。 Feedparser api允许我们解析标准兼容的ATOM和RSS feed。因此,期望ETag作为头部属性而不是作为身体元素的属性发送。这就是feedparser抛弃非标准etag属性的原因。这不是feedparser的限制,因为可以检索正确的etags,如文档@ http://packages.python.org/feedparser中所述。所以我认为你必须将原子提要解析为XML文档。