将utf-8代码的字符串转换为真正的unicode字符串

时间:2014-11-30 15:06:29

标签: python string unicode

现在我有unicode代码的字符串,如"\u8fea\u514b",如何将其转换为真正的unicode对象,如python中的u"\u8fea\u514b"

2 个答案:

答案 0 :(得分:0)

>>> s = "\u8fea\u514b"
>>> type(s)
<type 'str'>
>>> s.decode('unicode-escape')
u'\u8fea\u514b'
# OR
>>> new_s = unicode(s, 'unicode-escape')
>>> type(new_s)
<type 'unicode'>
>>> new_s
u'\u8fea\u514b'

您可以使用Unicode类将字符串输入到Unicode。

class unicode(basestring)
 |  unicode(string [, encoding[, errors]]) -> object
 |
 |  Create a new Unicode object from the given encoded string.
 |  encoding defaults to the current default string encoding.

答案 1 :(得分:0)

只需使用string.decode('unicode-escape')

即可
>>> "\u8fea\u514b".decode('unicode-escape')
u'\u8fea\u514b'