3字节可变宽度Unicode编码方案的名称是什么?

时间:2012-01-12 11:33:46

标签: unicode encoding

大家好,我想知道Unicode编码方案的名称是什么:

代码点U + 1到U + 7F用一个字节表示:

   Byte 1: 0xxxxxxx

代码点U + 80到U + 3FFF用两个字节表示:

   Byte 1: 0xxxxxxx
   Byte 2: 1xxxxxxx

代码点U + 4000到U + 10FFFF用三个字节表示:

   Byte 1: 0xxxxxxx
   Byte 2: 1xxxxxxx
   Byte 3: 1xxxxxxx

从我所看到的,这个方案胜过UTF-8,因为只需要一到三个字节来表示每个CodePoint(UTF-8需要1到4个字节来表示单个CodePoint),我想知道是否有此编码的官方名称。

1 个答案:

答案 0 :(得分:3)

您的实际问题似乎是此编码的“名称”。虽然很难证明是负面的,但我会说,没有其他人发布并命名这种编码。你刚刚发明了它。因此,您的答案是此编码没有名称。为它创建一个名称,这将是它的名称。

你还补充说,“从我所看到的,这个方案胜过UTF-8 ......”。评论中有关于该主张的讨论。如果您想将此作为单独的问题发布,例如“这种编码方案是否优于UTF-8”,这将是另一回事。提示:如果您这样做,请考虑使用哪个标准来衡量“更好”。根据UTF-8自己的设计标准,您认为您的新编码方案优于UTF-8 吗?