将Unicode转换为UTF 32

时间:2015-05-07 10:32:10

标签: unicode utf-32

我如何将U+0065转换为UTF-32格式?

U+0065
0000 0000 0110 0101

UTF-32
xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxxx

将U + 0065转换为UTF-32:

 0000 0000 0000 0000 0000 0000 0110 0101

十六进制的结果是0x00000065

这是对的吗?

1 个答案:

答案 0 :(得分:1)

是的,这是正确的。

UTF-32始终使用32位写入。 Unicode将代码点定义为U + 10FFFF,使用21位。因此,UTF-32值始终与代码点本身相同。

因为U + 0065在U + 0000..U + 007F范围内,所以使用8位(01100101)以UTF-8写入。在UTF-16中,使用16位(00000000 01100101)是相同的,在UTF-32中使用32位(00000000 00000000 00000000 01100101)。