我正在使用chr()遍历Unicode字符列表,但是只要遇到未分配的字符,它就会继续运行,并且不会出错或发生任何错误。如何检查chr()的输出是否未定义?
例如
print(chr(55396))
在unicode范围内,它只是一个未分配的字符,我如何检查chr()的输出将为我提供一个实际的字符,以使这种挂断不会发生?
答案 0 :(得分:3)
您可以使用unicodedata模块:
>>> import unicodedata
>>> unicodedata.name(chr(55396))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ValueError: no such name
>>> unicodedata.name(chr(120))
'LATIN SMALL LETTER X'
>>>