解码文件输入

时间:2012-08-29 14:29:52

标签: python encoding

我有一个包含此内容的纯文本文件:

Test: \u0410\u0412\u0422\u041e

我尝试在python中读取该文件并以unicode打印字符,如下所示:

import codecs
f = codecs.open('b.txt', encoding='utf-8')
for line in f:
    print line

输出:

Test: \u0410\u0412\u0422\u041e

我正在阅读这篇文章:

Test: ABTO

“测试”后面的单词用于STOP。

1 个答案:

答案 0 :(得分:2)

你有一个带有unicode转义序列的ascii文件; \u0410...形式我们必须将其转换为\\u0410....形式,以便我们可以按如下方式应用解码函数。

f = open('b','r')
for line in f:
    line.replace('\u','\\u')
    print line.decode('unicode-escape')