如何在python中从unicode代码点转换为实际的unicode字符串?

时间:2014-06-06 02:32:54

标签: python unicode

我有一个包含unicode代码点列表的文件:

0x9C00
0x9D70
0x9D6B
0xFA2D

我正在尝试创建一个unicode字符数组,如下所示:

with open("KANJI.TXT") as f:
    kanjiCodes = f.readlines()

alphabet = [
    code_point for code_point in kanjiCodes
]

如何将这些0x字符串转换为实际的unicode字符串?

2 个答案:

答案 0 :(得分:1)

使用unichr

print unichr(0x9C00)

答案 1 :(得分:1)

在python 3.x中你可以这样做:

kanjiCodes=['0x9C00', '0x9D70','0x9D6B', '0xFA2D']

print([chr(int(code_point, 16)) for code_point in kanjiCodes])
# ['鰀', '鵰', '鵫', '鶴']