如何使用python中的\ u00e7等unicodes解码文本?

时间:2014-02-08 12:56:51

标签: python python-2.7 unicode utf-8 character-encoding

您好我从via库接收文本,当我打印收到的文本时,我看到一些非英文字符为“\ u00e7”,而不是“ç”。我猜不知道我需要对文本进行编码和重新解码,但我对python很新,如果是正确的方法,我不会这样做。你能指教我吗?

1 个答案:

答案 0 :(得分:4)

使用unicode_escape encoding解码字符串:

>>> s = r'\u00e7'
>>> print s
\u00e7
>>> print s.decode('unicode-escape')
ç
>>> 

如果sys.stdout.encodingascii,则会打印UnicodeEncodeError;在这种情况下,请明确编码:

>>> print s.decode('unicode-escape').encode('utf-8')
ç