我有一个包含此内容的纯文本文件:
Test: \u0410\u0412\u0422\u041e
我尝试在python中读取该文件并以unicode打印字符,如下所示:
import codecs
f = codecs.open('b.txt', encoding='utf-8')
for line in f:
print line
输出:
Test: \u0410\u0412\u0422\u041e
我正在阅读这篇文章:
Test: ABTO
“测试”后面的单词用于STOP。
答案 0 :(得分:2)
你有一个带有unicode转义序列的ascii文件; \u0410...
形式我们必须将其转换为\\u0410....
形式,以便我们可以按如下方式应用解码函数。
f = open('b','r')
for line in f:
line.replace('\u','\\u')
print line.decode('unicode-escape')