为什么将Unicode编码自然地视为32位整数数组?

时间:2015-12-21 11:46:54

标签: character-encoding theory

我正在阅读有关Unicode的Python指南。在this section中,它说:

总结上一节:Unicode字符串是一系列代码点,它们是从0到0x10ffff的数字。该序列需要在内存中表示为一组字节(意思是0-255的值)。将Unicode字符串转换为字节序列的规则称为编码。

您可能会想到的第一个编码是32位整数数组 。在此表示中,字符串“Python”将如下所示:

   P           y           t           h           o           n
0x50 00 00 00 79 00 00 00 74 00 00 00 68 00 00 00 6f 00 00 00 6e 00 00 00
   0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

如果代码点是从0到0x10ffff的数字,为什么我们会想到32位整数?也许是假设我们在32位系统上?

0 个答案:

没有答案