最近我学习了Unicode,并下载了它的代码表。并在visual studio上测试不同的语言支持。
我用一个中文单词作为例子,它是我的。 Chinese Charcter我,Unicode编号为U-6211。
我测试visual studio如何存储这个单词,并找出字符串是CED2,例如。
#include <stdio.h>
int main(void)
{
unsigned char *p="我";
while(*p)
{
fprintf(stdout, "%2X ", (unsigned int)*p);
p++;
}
return 0;
}
我在屏幕上看到的是CE D2,我知道UTF-8,UTF-16,UCS-2是如何编码的。但我无法找到匹配。我想这是一个叫做DBCS的东西。
我的问题是,如何将unicode转换为这个DBCS似乎?
感谢您的帮助。
答案 0 :(得分:0)
我在简体中文环境中使用Visual Studio。
Charcter set正在使用带有GBK模式的DBCS ...是这个特殊的未知GBK
http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WindowsBestFit/bestfit936.txt
这是代码表,没有更进一步。