我正在尝试使用feedparser从feed中检索某些特定信息,但也检索每个条目的原始XML(即RSS和Atom的元素),我看不到如何做到这一点。显然我可以手工解析XML,但这不是很优雅,需要单独支持RSS和Atom,而且我想它可能会与feedparser的不正确的feed不同步。还有更好的方法吗?
谢谢!
答案 0 :(得分:2)
我是feedparser的当前开发者。目前,获取该信息的方法之一是monkeypatch feedparser._FeedParserMixin
(或编辑feedparser.py的本地副本)。您要修改的方法是:
feedparser._FeedParserMixin.unknown_starttag
feedparser._FeedParserMixin.unknown_endtag
在每个方法的顶部,您可以将回调插入到您自己的例程中,该例程将捕获feedparser遇到的元素及其属性。