Unicode标准中正确的表情符号列表是什么?

时间:2017-02-03 14:07:08

标签: unicode emoji

我正在尝试找到Unicode标准定义的表情符号代码点的官方列表,并且遇到了一些冲突的来源:根据emoji-data.txt偶数数字是表情符号; unicode.org上的其他来源建议只将该列表的一部分作为表情符号,例如the emoji chartemoji test file。甚至在Unicode技术报告#51中有一个名为Which Characters are Emoji的部分,但它并没有真正回答我的问题,或者至少我看不到它。

那么,哪些Unicode代码点是表情符号?

1 个答案:

答案 0 :(得分:4)

并非所有表情符号都是从单个Unicode代码点创建的。某些字符在组合成“表情符号序列”时仅具有表情符号外观。这使得很难仅通过代码点来计算表情符号字符。这是Section 3 in UTR #51试图传达的内容,但可以通过一些例子进行改进:

  • U+0031为1,但与U+FE0F U+20E3结合使用表情符号:1️⃣(或带有U+FE0E U+20E3的简单外观:1︎⃣)。
  • U+1F170是,但与U+FE0F结合使用时表现出表情符号:️。
  • U+2620是☠︎,但与U+FE0F结合使用表情符号:☠️。
  • (通常,U+FE0F variation sequence用于将许多现有字符转换为相应的表情符号序列,而不必将它们编码为单独的代码点。)
  • 区域指标符号仅在形成国家/地区代码时显示为表情符号:U+1F1E6 U+1F1F6,而不是U+1F1E6 U+1F1F5

emoji-data.txt文件列出了具有Emoji=Yes字符属性的所有字符。这些都是基本字符(例如1,☠︎,,,),它们至少可以启动表情符号序列,即使它们本身不是完整的序列。 emoji-test.txt文件列出了所有完整的表情符号序列。