使用feedparser检索项目的原始XML

时间:2011-10-30 15:06:03

标签: python xml rss atom-feed feedparser

我正在尝试使用feedparser从feed中检索某些特定信息,但也检索每个条目的原始XML(即RSS和Atom的元素),我看不到如何做到这一点。显然我可以手工解析XML,但这不是很优雅,需要单独支持RSS和Atom,而且我想它可能会与feedparser的不正确的feed不同步。还有更好的方法吗?

谢谢!

1 个答案:

答案 0 :(得分:2)

我是feedparser的当前开发者。目前,获取该信息的方法之一是monkeypatch feedparser._FeedParserMixin(或编辑feedparser.py的本地副本)。您要修改的方法是:

  • feedparser._FeedParserMixin.unknown_starttag
  • feedparser._FeedParserMixin.unknown_endtag

在每个方法的顶部,您可以将回调插入到您自己的例程中,该例程将捕获feedparser遇到的元素及其属性。