' ASCII'编解码器无法对字符u' \ u2013'进行编码。

时间:2014-05-20 07:48:35

标签: python unicode encoding encode

我正在使用Wikipedia.py从Wikipedia部分获取信息。 这样做时,我在以下Python代码中遇到编码问题:

for section in data.sections:
        info = data.section(section).encode('utf-8')
        info = info.encode('string_escape')
        print info

数据变量是整个维基百科页面。 每次运行脚本时,都会收到以下错误:

  

'ascii'编解码器不能编码字符u'\ u2013'

1 个答案:

答案 0 :(得分:0)

您必须首先通过维基百科部分的编码解码data.section(section)

假设Wikipedia部分的编码为gbk,代码片段如下:

for section in data.sections:
    # Please check encoding in decode() first.
    info = data.section(section).decode('gbk').encode('utf-8')
    info = info.encode('string_escape')
    print info