在Jython中,如何从UTF-8字节序列创建unicode字符串?

时间:2014-06-25 13:22:31

标签: python unicode utf-8 jython decoding

日语Unicode字符'あ的UTF-8表示是三字节序列,E38182。我把它放在像这样的Jython列表中;

>>> [0xE3, 0x81, 0x82]
[227, 129, 130]

我可以将这个UTF-8字节序列表转换为Jython的unicode字符串吗?我想输出'あ'通过打印unicode字符串,如下所示;

str = convert_utf8_list_to_unicode([0xE3, 0x81, 0x82])
print str # => あ

环境

  • 操作系统:Mac OS X 10.9.3 Mavericks
  • Jython:2.5.3
  • Java:1.6.0_65

1 个答案:

答案 0 :(得分:1)

试试这个:

a = [0xE3, 0x81, 0x82]
print "".join([chr(c) for c in a]).decode('UTF-8')

这适用于常规Python。我不知道Jython是否有所不同。