用Java解码十六进制NCR

时间:2013-10-26 14:11:10

标签: java html escaping decode

我想使用Java来解码我从网站的HTTP GET请求获得的以下字符串:

  • Ö
  • '
  • ü

(我实际上必须将它们放入代码博客中,Stackoverflow会自动解码它们,我希望我能尽快完成它;)

这些相等(我想要解码)

  • Ö
  • ü

我如何解码它们?我试过Apache Commons lang:

StringEscapeUtils.unescapeHtml4(string);

它可以转换'但不能转换其他的(德国特殊字符)。

你知道吗?我找到了它的在线解码器(如http://rishida.net/tools/conversion/),但我找不到任何有效的功能......

2 个答案:

答案 0 :(得分:1)

您可以使用JSoup

import org.jsoup.Jsoup;
...
String parsed = Jsoup.parse("Ö'ü").text();
System.out.print(parsed);  // prints Ö'ü

答案 1 :(得分:1)

我发现了它无法正常工作的原因。我的java文件未保存为UTF-8编码。要在eclipse中设置它,你必须去 常规 - >工作区 - >文本文件编码 - >其他并选择 UTF-8

Settings of text encoding

在此之后,Apache Commons LangJSoup正在运作。