我们的XML Feed为ISO-8859-1中的编码UTF-8字符提供了一个文件。这被送入数据库。所以文本是ISO-8859-1编码,包含以下内容:
金融市场
有没有办法将其转换为普通的Java字符串?类似于:
String str = fromHtmlUtf8("金融市场");
结果str将包含正常的UTF8字符。在这种情况下,中国人可能会很混杂。
感谢。
答案 0 :(得分:3)
您可以使用Apache Commons的StringEscapeUtils: http://commons.apache.org/lang/api-2.6/org/apache/commons/lang/StringEscapeUtils.html
答案 1 :(得分:0)
如果您需要小型lib,可以使用HTMLEntitles
http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlentities