每个Unicode字符的规范名称

时间:2015-04-02 22:37:52

标签: python unicode

>>> from unicodedata import name, lookup
>>> name('a')
'LATIN SMALL LETTER A'
>>> name('☃')
'SNOWMAN'
>>> name('A')
'LATIN CAPITAL LETTER A'
>>> name('`')
'GRAVE ACCENT'
>>> name('☹')
'WHITE FROWNING FACE'
>>> name('☺')
'WHITE SMILING FACE'

我知道Unicode是字符和整数之间的对应关系。

UTF-8是数字和字节之间的对应关系。 Python遵循UTF-8编码。

但是,

规划中规范名称的用法是什么?它是否特定于python?

U+263a WHITE SMILING FACE
U+2639 WHITE FROWNING FACE

2 个答案:

答案 0 :(得分:2)

不,它不是特定于Python。这些是Unicode标准给代码点的名称。

答案 1 :(得分:1)

正如另一个已经提到的答案,不,它们不是特定于Python 。它们是Unicode Consortium设置的Unicode字符的名称。您可以在其网站上的character charts中查看字符的名称。 Python docs也有关于Unicode的page