像ASCII一样,如何在UNICODE中为字符分配二进制值?

时间:2014-02-18 07:29:23

标签: unicode ascii bit representation

ASCII使用8位系统。每个字符都分配有唯一的ASCII值。但是UNICODE使用32或64位表示。那么字符在那里如何赋值? C / C ++是否使用UNICODE?

2 个答案:

答案 0 :(得分:0)

来自this

  

要将ASCII转换为Unicode,请取所有一个字节的ASCII码,并将它们零扩展到16位。那应该是ASCII字符的Unicode版本。

c / c ++中的Unicode查看this

答案 1 :(得分:0)

Unicode首先通过代码点定义字符。这只是一个巨大的表,它指定字母“A”(拉丁文大写字母A)的代码点为U + 0041,“ท”(THAI CHARACTER THO THAHAN)的代码点为U + 0E17,依此类推

然后有几个Unicode 编码将这些代码点编码为物理位。 UCS-2是一种早期编码,现在被UTF-16取代。 UTF-32也存在,但UTF-8已成为事实上的标准Unicode编码。每种编码的工作方式不同,有不同的优点和缺点,如果您感兴趣,请详细阅读其规范。最明显的区别是UTF-8使用每个字符8位的最小,UTF-16 16位的最小和32位的UTF-32。