U + 0080至U + 009F的有效用法是什么?

时间:2019-06-20 13:26:46

标签: unicode

我正在制作一台具有自定义字体和编程环境(Mini Micro)的虚拟计算机,它们均基于Unicode。我的环境中需要一些自定义字形。我知道Private Use Areas,但我想知道U + 0080至U + 009F的“控制”代码点。除了“控制”之外,我找不到任何有关这些要点的文档。

将我的一些自定义字形放到其中会严重滥用Unicode吗?正确使用什么

3 个答案:

答案 0 :(得分:1)

维基百科列出了their meaning。您会得到其中两个供您使用的U + 0091和U + 0092。

答案 1 :(得分:0)

您所指的 0x80 - 0x9F 范围通常称为 C1 control characters。与其他控制代码一样,C1 用于代码扩展,并且就其本质而言,有些通常是开放的以供进一步扩展,因此只有模糊的标准化。

最原始和最全面的参考可能是 ECMA-48 - 直到 1991 年 6 月的第五版。(该链接可让您免费下载 PDF 格式。)

对于其他字形,C1 代码是合适的。实际上,控制代码的整体思想是它们是非图形代码的特例。

UNICODE 不断发展,表情符号块中包含许多您可能意想不到的“字符”。让我们试一试:? 它的官方名称是 GemStone Emoji。我用这个 copy/paste website 来插入它,你可以看看你可以使用的东西是否已经在 Emoji 代码块中标准化了。

表情符号字符的一个有趣之处在于它们是双倍宽度的,即使是固定宽度的字体。

答案 2 :(得分:-3)

Microsoft使用它们在latin-1扩展名cp1252中为欧元和其他一些符号提供智能报价。由于此字符编码经常被报告为latin-1,因此将这些代码点用于其他用途可能会引起问题,尤其是因为latin-1被认为与Unicode等价。 This维基百科页面提供了一些历史和这些控制字符的含义。