Java Normalizer类未正确规范韩语音节

时间:2016-08-17 15:37:41

标签: java unicode normalize

我正在尝试使用Java的Normalizer类将ㅇ,ㅞ,ㄴ合并到。标准化字符串后,它将输出웨ㄴ

如果我String x = "ㅇㅞᆹ"Normalizer.normalize(x, Normalizer.Form.NFKC)它工作正常并输出

另外我想指出,有时相同的字符有不同的数字代码:

public void normalize() {
    char test[] = {'ㅄ'};
    System.out.println((int)'ㅄ');
    System.out.println((int)test[0]);
}

输出:

4537
12612

我做错了什么?为什么Java不会将字符规范化为单个音节,为什么相同的字符产生不同的数值?

0 个答案:

没有答案