我在一个通常用于RSS网址的脚本中使用了feedparser,但是有一个令我头疼的网址:tabbforum.com/feed.atom
我得到import feedparser
def read_from_feed(self, rss_url):
feed = feedparser.parse(rss_url)
for entry in feed.entries:
print('do stuff')
>>>>feed
{'feed': {}, 'entries': [], 'bozo': 1, 'encoding': 'utf-8', 'version': '', 'bozo_exception': SAXParseException('not well-formed (invalid token)',), 'namespaces': {}}
。
TRIM
我认为xml(?)出现了问题。有没有人有过以前的经验,并且能够找到一个解决方案?或者知道问题是什么?
答案 0 :(得分:1)
有类似的问题。在我的情况下,我忘记将http://
放在URL前面,feedparser将其视为URL,而不是RSS XML。