Python使用feedparser从RSS编码文本

时间:2014-07-24 12:19:11

标签: python encoding rss feedparser

我尝试使用feedparser模块解析来自RSS Feed的数据。

import feedparser

def main():
    try:
        rss = feedparser.parse('http://s.stooq.pl/rss/n.rss')
        print(rss.entries[0].title)

    except Exception as e:
        print(str(e))
main()

给出了以下输出:

' ASCII'编解码器无法对字符' \ xf3'进行编码。位置55:序数不在范围内(128)

我尝试将编码更改为UTF-8,但结果如下:

b' Zostaniemy obs \ xc5 \ x82u \ xc5 \ xbceni w ka \ xc5 \ xbcdym urz \ xc4 \ x99dzie skarbowym' 所以这似乎是字节文字。

我该怎么做才能正确显示这个字符串?

1 个答案:

答案 0 :(得分:-1)

假设属性title是一个字符串,您可以尝试:

print(rss.entries[0].title.encode('utf-8'))