Question

我尝试使用feedparser模块解析来自RSS Feed的数据。

import feedparser

def main():
    try:
        rss = feedparser.parse('http://s.stooq.pl/rss/n.rss')
        print(rss.entries[0].title)

    except Exception as e:
        print(str(e))
main()

给出了以下输出：

＆＃39; ASCII＆＃39;编解码器无法对字符＆＃39; \ xf3＆＃39;进行编码。位置55：序数不在范围内（128）

我尝试将编码更改为UTF-8，但结果如下：

b＆＃39; Zostaniemy obs \ xc5 \ x82u \ xc5 \ xbceni w ka \ xc5 \ xbcdym urz \ xc4 \ x99dzie skarbowym＆＃39; 所以这似乎是字节文字。

我该怎么做才能正确显示这个字符串？

Answer 1

假设属性title是一个字符串，您可以尝试：

print(rss.entries[0].title.encode('utf-8'))

Python使用feedparser从RSS编码文本

1 个答案: