将传入字符串上的unicode表示转换为UTF-8?

时间:2009-03-23 11:01:29

标签: java utf-8

我正在阅读一些已经转换为html风格υ代码的数据。

我现在需要将其转换回UTF-8字符以供查看。不幸的是我不能使用浏览器来查看字符串。

我已经读过有关java中的转换的内容,看起来如果你有一个字符串\ uxxxx那么编译器会为你转换;然而,这当然不会起作用,因为我想阅读动态字符串。

那可以这样做吗?

非常感谢! 丹

3 个答案:

答案 0 :(得分:4)

您需要使用:

String StringEscapeUtils.unescapeJava(String str)

来自Apache Commons Library。

它将在输入字符串中找到\uxxxx个序列,并将它们转换为普通的Java字符串。

答案 1 :(得分:0)

native2ascii

使用“-reverse”选项。

答案 2 :(得分:0)

  

转换为html风格υ代码。

其中哪些? \uXXXX是一种Java约定,与HTML无关。 HTML实体看起来像¯