Question

我在一个通常用于RSS网址的脚本中使用了feedparser，但是有一个令我头疼的网址：tabbforum.com/feed.atom

我得到import feedparser def read_from_feed(self, rss_url): feed = feedparser.parse(rss_url) for entry in feed.entries: print('do stuff') >>>>feed {'feed': {}, 'entries': [], 'bozo': 1, 'encoding': 'utf-8', 'version': '', 'bozo_exception': SAXParseException('not well-formed (invalid token)',), 'namespaces': {}}。

TRIM

我认为xml（？）出现了问题。有没有人有过以前的经验，并且能够找到一个解决方案？或者知道问题是什么？

Answer 1

有类似的问题。在我的情况下，我忘记将http://放在URL前面，feedparser将其视为URL，而不是RSS XML。

Feedparser SAXParseException，bozo：1

1 个答案: