大家好,我想知道Unicode编码方案的名称是什么:
代码点U + 1到U + 7F用一个字节表示:
Byte 1: 0xxxxxxx
代码点U + 80到U + 3FFF用两个字节表示:
Byte 1: 0xxxxxxx
Byte 2: 1xxxxxxx
代码点U + 4000到U + 10FFFF用三个字节表示:
Byte 1: 0xxxxxxx
Byte 2: 1xxxxxxx
Byte 3: 1xxxxxxx
从我所看到的,这个方案胜过UTF-8,因为只需要一到三个字节来表示每个CodePoint(UTF-8需要1到4个字节来表示单个CodePoint),我想知道是否有此编码的官方名称。
答案 0 :(得分:3)
您的实际问题似乎是此编码的“名称”。虽然很难证明是负面的,但我会说,没有其他人发布并命名这种编码。你刚刚发明了它。因此,您的答案是此编码没有名称。为它创建一个名称,这将是它的名称。
你还补充说,“从我所看到的,这个方案胜过UTF-8 ......”。评论中有关于该主张的讨论。如果您想将此作为单独的问题发布,例如“这种编码方案是否优于UTF-8”,这将是另一回事。提示:如果您这样做,请考虑使用哪个标准来衡量“更好”。根据UTF-8自己的设计标准,您认为您的新编码方案优于UTF-8 吗?