哪些字符集每个字符需要超过16位?

时间:2018-10-09 19:44:06

标签: character-encoding limit legacy cjk

除了Unicode以外,是否还有其他字符集要求字符集中的某些代码点的超过 16位?即最大字符代码点大于65535的地方。

我不是要查找字符 encodings ,其中 byte打包方案会导致原本适合16位的代码点占用字符串中的更多位。我只想提供一种在单个机器字中存储单个“旧式”字符索引的方法。空间太紧,我想知道是否应该进行特殊安排以为任何特定字符集(Unicode除外)保留超过16位。我的字符串不受空间限制,因此每个代码点字符 encodings 可以超过16位(两个字节)。

我要问的另一个原因是简单的好奇心。我一直想知道在Unicode出现之前,是否有任何系统必须求助于16位以上的比特。

TRON code是迄今为止我发现的唯一一个字符,它是其他字符集(例如Unicode,但没有汉字统一)的合并。根据Wikipedia的说法,它支持1.5亿个代码点。

page about Encodings of Japanese暗示某些JIS X编码具有三个字节,但是我无法弄清楚它们是仅表示编码还是某些JIS X字符集是否也具有大于65535的代码点。

0 个答案:

没有答案