应用错误收集

使用feedparser检索项目的原始XML

时间：2011-10-30 15:06:03

标签： python xml rss atom-feed feedparser

我正在尝试使用feedparser从feed中检索某些特定信息，但也检索每个条目的原始XML（即RSS和Atom的元素），我看不到如何做到这一点。显然我可以手工解析XML，但这不是很优雅，需要单独支持RSS和Atom，而且我想它可能会与feedparser的不正确的feed不同步。还有更好的方法吗？

谢谢！

1 个答案:

答案 0 :(得分：2)

我是feedparser的当前开发者。目前，获取该信息的方法之一是monkeypatch feedparser._FeedParserMixin（或编辑feedparser.py的本地副本）。您要修改的方法是：

feedparser._FeedParserMixin.unknown_starttag
feedparser._FeedParserMixin.unknown_endtag

在每个方法的顶部，您可以将回调插入到您自己的例程中，该例程将捕获feedparser遇到的元素及其属性。

使用Feedzirra检查更新的RSS源
从RSS源检索原始数据
使用feedparser检索项目的原始XML
使用xsl：key检索兄弟姐妹
feedparser不会给NOAA xml带来长时间
python feedparser不一致的项目
从feedparser媒体中检索网址：内容
如何处理html中的特殊字符
用于检索XML中的项目的Xpath
如何查找与列表中的项目匹配的多个字符串中的项目

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？