我正在使用Wikipedia.py从Wikipedia部分获取信息。 这样做时,我在以下Python代码中遇到编码问题:
for section in data.sections:
info = data.section(section).encode('utf-8')
info = info.encode('string_escape')
print info
数据变量是整个维基百科页面。 每次运行脚本时,都会收到以下错误:
'ascii'编解码器不能编码字符u'\ u2013'
答案 0 :(得分:0)
您必须首先通过维基百科部分的编码解码data.section(section)
。
假设Wikipedia部分的编码为gbk
,代码片段如下:
for section in data.sections:
# Please check encoding in decode() first.
info = data.section(section).decode('gbk').encode('utf-8')
info = info.encode('string_escape')
print info