适当的NFD形式的表情符号和比较

时间:2016-09-20 13:59:25

标签: unicode nfd

鉴于某些代码点现在有一个文本与表情符号显示选择器,这些代码点的正确分解形式是什么?例如,❤︎(U + 2764)默认为文本表示,但如果后跟VS-16(U + fe0f),则可以成为表情符号:❤️。您可以使用VS-15强制文本表示(U + fe0e)。这是否意味着U + 2764的NFD应该变为U + 2764 U + fe0e?如果U + 2764 U + fe0e和U + 2764被视为相同(同样的方式é(U + 00e9)与é(U + 0065 U + 0301)相同)?文本与表情符号表示怎么样?它们应该同样对待吗?

1 个答案:

答案 0 :(得分:1)

表情符号和变体选择器的decomposition mapping中没有Unicode database。标准even states

  

变体序列中的初始字符绝不是规范的可分解字符。

这意味着有或没有变异选择器的表情符号在NFD下不会改变。

另外,据我所知,Unicode没有指定没有变体选择器的代码点的默认表示。这取决于实施。