utf-8中的汉字字符

时间:2013-07-25 19:41:38

标签: python unicode utf-8

>>> s='未作評級'
>>> s
'\xe6\x9c\xaa\xe4\xbd\x9c\xe8\xa9\x95\xe7\xb4\x9a'
>>> s = unicode(s)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe6 in position 0: ordinal not in range(128)

如何将未作評級转换为uniciode?

1 个答案:

答案 0 :(得分:6)

从头开始使用Unicode字符串:

>>> s = u'未作評級'

解码来自其当前编码的字符串(看起来是UTF-8)。然后你得到一个Unicode字符串。

>>> s = '未作評級'.decode("utf-8")