某些Unicode代码点似乎需要5个十六进制字符。
例如,
\u11143
CHAKMA问号\u1039f
缩略词除法器\u103d0
老波斯语单词除法器\u12470
楔形文字标点符号旧的阿拉伯语单词除法\u1091f
菲律宾单词分隔符(搜索here来验证值。)
在将它们输入Python 3字符串(默认为Unicode)时,解释器认为"\u11143"
(""
)是"\u1114" + "3"
("њ3"
)。 / p>
如何让Python 3认识到我的意思是前者?我可以使用chr(0x11143)
,但我想知道更好的方法。