如何将列表解码为'UTF-8'

时间:2013-10-30 15:15:09

标签: python unicode utf-8

我有一个list = [0x97,0x52],而不是unicode对象。这是一个字符'青'(u'\ u9752')的unicode。我怎么能先将这个列表更改为unicode对象,然后编码为'UTF-8'?

2 个答案:

答案 0 :(得分:2)

bytes = [0x97, 0x52]

code = bytes[0] * 256 + bytes[1]  # build the 16-bit code
char = unichr(code)               # convert code to unicode
utf8 = char.encode('utf-8')       # encode unicode as utf-8
print utf8                        # prints '青'

答案 1 :(得分:0)

不确定这是否是最优雅的方式,但它适用于此特定示例。

>>> ''.join([chr(x) for x in [0x97, 0x52]]).decode('utf-16be')
u'\u9752'