如何解码unicode原始文字到可读字符串?

时间:2011-06-28 09:14:59

标签: python string unicode encoding unicode-literals

如果我将unicode原始文字分配给变量,我可以读取它的值:

>>> s =  u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e'
>>> s
u'\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e'
>>> print s
Сообщение отправлено

但是当我已经为普通字符串而不是unicode字符串赋值时,我不能:

>>> s =  '\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e'
>>> s
'\\u0421\\u043e\\u043e\\u0431\\u0449\\u0435\\u043d\\u0438\\u0435 \\u043e\\u0442\\u043f\\u0440\\u0430\\u0432\\u043b\\u0435\\u043d\\u043e'
>>> print s
\u0421\u043e\u043e\u0431\u0449\u0435\u043d\u0438\u0435 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043e

如何解码和阅读?

2 个答案:

答案 0 :(得分:32)

使用unicode_escape codec

s.decode('unicode_escape')

答案 1 :(得分:0)

如果您在解码时遇到奇怪的结果,请尝试以下

print repr(s).decode('unicode-escape').encode('latin-1') // or encode using some other encoding

可能是python终端使用的是默认ASCII,并且有符号超出范围。