是否有一个java函数/代码示例可以帮助我将一些unicode字符转换为可读的对应字符?
例如:
原始 已转换
¿ ?
A A
A A
A A
A A
A A
A A
Æ A
C C
Ø 0
Ñ 名词
× 。
I 我
I 我
d d
Ñ 名词
或者你会怎么做?
答案 0 :(得分:0)
使用Normalizer类,但它不会为你完成整个工作(但它会做很多事情,所以你可以单独处理角落情况)。可以使用以下内容删除重音符号和其他变音符号(将字符分解为基本字符和变音符号,然后删除变音符号)。
String foo = Normalizer.normalize("¿ÀÁÀÃÄÅÆÇØÑ×ÎÏÐÑ", Form.NFD).replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
之后,您仍然需要处理未转换的字符(¿ÆØ×Ð
)。
从here借来的代码段。