编码拼音

时间:2013-02-12 18:06:39

标签: java encode ansi iso

我目前正在用java开发一个程序,我想显示中文拼音,我是从一个遥远的网站上得到的。

但我有以下问题:中文拼音以这种方式显示:jiǎ
它应该以这种方式显示:jiǎ
(我只是键入了相同的序列,除了我删除了斜杠)。

我认为这个问题的答案很简单,但我很难找到它。

1 个答案:

答案 0 :(得分:0)

问题是你有一个HTML编码的Unicode字符,你想要的是它的解码版本。像commons-lang3(Apache Commons的一部分)这样的库将使用HTML编码的字符串并将其解码为Java以显示如下:

String decoded = StringEscapeUtils.unescapeHtml("jiǎ");

你也可以像这样在Java中转义Unicode字符:

String jia = "ji\u01ce";

这个聪明的one-liner将采用Unicode字符并向您显示其转义形式:

System.out.println( "\\u" + Integer.toHexString('ǎ' | 0x10000).substring(1) );