为什么unicode Superscripts和Subscripts块不包含所有字母的简单序列?

时间:2011-07-10 00:48:55

标签: unicode

可以用作超级/下标字母的字符排列似乎完全混乱。其中大多数显然意味着用作sup / subscr。信件,但即使是那些没有提示非常合理的订单。在Unicode 6.0中,现在终于在U + 2095到U + 209C中有下划线字母ht的按字母排序的子集,但这明显相当于块中的剩余空间并且包含不到所有字母的1/3

为什么联盟不仅仅为小写字母分配至少一个sup和一个下标字母表的足够空间?

1 个答案:

答案 0 :(得分:6)

这些字符排列的混乱是因为它们是零碎编码的,因为使用它们的脚本被编码,并且添加了与其他字符集的往返兼容性。 Unicode标准Chapter 15对其起源进行了一些讨论:例如,上标数字1到3位于ISO Latin-1,而其他数字则编码为支持MARC-8书目字符集({{3} }});和U + 2071 SUPERSCRIPT LATIN小写字母I和U + 207F SUPERSCRIPT LATIN小写字母N编码为支持see table here

Unicode Consortium的一般政策是不对字符进行编码,除非有一些证据表明人们正在使用这些字符来进行需要编码的语义区别。因此,字符不会被编码只是为了完成集合,或者使事物看起来很整洁。