我如何将U+0065
转换为UTF-32格式?
U+0065
0000 0000 0110 0101
UTF-32
xxxx xxxx xxxx xxxx xxxx xxxx xxxx xxxxx
将U + 0065转换为UTF-32:
0000 0000 0000 0000 0000 0000 0110 0101
十六进制的结果是0x00000065
这是对的吗?
答案 0 :(得分:1)
是的,这是正确的。
UTF-32始终使用32位写入。 Unicode将代码点定义为U + 10FFFF,使用21位。因此,UTF-32值始终与代码点本身相同。
因为U + 0065在U + 0000..U + 007F范围内,所以使用8位(01100101
)以UTF-8写入。在UTF-16中,使用16位(00000000 01100101
)是相同的,在UTF-32中使用32位(00000000 00000000 00000000 01100101
)。