在Java中将HTML字符代码转换为char

时间:2011-07-12 18:50:10

标签: java html encoding utf-8

我们的XML Feed为ISO-8859-1中的编码UTF-8字符提供了一个文件。这被送入数据库。所以文本是ISO-8859-1编码,包含以下内容:

金融市场

有没有办法将其转换为普通的Java字符串?类似于:

String str = fromHtmlUtf8("金融市场");

结果str将包含正常的UTF8字符。在这种情况下,中国人可能会很混杂。

感谢。

2 个答案:

答案 0 :(得分:3)

答案 1 :(得分:0)

如果您需要小型lib,可以使用HTMLEntitles

http://www.tecnick.com/public/code/cp_dpage.php?aiocp_dp=htmlentities