为什么排除补充性PUA的最后两点?

时间:2016-06-30 12:50:45

标签: unicode

补充PUA(F0000-FFFFD和100000 10FFFD)通过将它们定义为非字符而明确地排除了FFFFE,FFFFF,10FFFE和10FFFF。 为什么这样做了?如果没有这个,他们将是很好的65536点块。

1 个答案:

答案 0 :(得分:1)

每个辅助平面的最后两个代码点被保留为“内部”使用的“非特征”代码点(参见this section of the Unicode FAQ)。它们可以在您的应用程序/系统中用作私有的专有标记 - 但它们不能在系统之间互换(unlike other PUA code points)。

至于为什么选择了这些代码点:它们是在Unicode 2.0(1996)中定义的,但标准中没有给出理由(并且寄存器中的历史文档不能在线获得)。一种可能性是它们易于识别:所有0x••••FFFE0x••••FFFF代码点都是非字符。