python中的32位unicode

时间:2014-12-30 09:41:43

标签: python unicode

Python有一个转义序列\u来显示unicode值。但是,这仅限于16位unicode值。那是

>>> '\u1020'
'ဠ'

而32位未编码值不起作用。那是

>>> '\u00001000'
'\x001000'

这显然是错误的。 python documentation提及

  

转义序列\ u0020表示在给定位置插入序号值为0x0020(空格字符)的Unicode字符。

1 个答案:

答案 0 :(得分:7)

python How To Unicode清楚地提到使用'\U'来表示32位unicode序列。

>>> "\u0394"                          # Using a 16-bit hex value
'Δ'
>>> "\U00000394"                      # Using a 32-bit hex value
'Δ'

在这种情况下

>>> '\U00001000'
'က'