UTF-8使用的前导位编码技术的名称是什么?

时间:2012-11-01 09:41:03

标签: algorithm encoding utf-8

UTF-8使用一种编码,其中第一个字节的前导位数是符号使用的字节数(单字节字符除外):

0xxxxxxx - 1 byte sequence
110xxxxx - 2 byte sequence
1110xxxx - 3 byte sequence
11110xxx - 4 byte sequence
...

忽略单字节情况,是否存在此编码技术的类似/先前使用?它有名字吗?

2 个答案:

答案 0 :(得分:1)

根据Wikipedia,使用的名称似乎是“连续字节”。

答案 1 :(得分:1)

使用连续位的替代方法用于variable-length integers

This patent application讨论了许多方法,包括这两种方法(大概是在提供更好的替代方案之前)。