我正在从资源文件中读取html文本
InputStream fstream = this.getClass().getClassLoader()
.getResourceAsStream(filename);
myString = IOUtils.toString(fstream, "UTF-8");
但是如果html包含特殊字符
McDonald's
它将其转换为McDonald?s
,如果我用'
替换apos
,我可以解决它,但还有其他方法可以解决它。是一些编码isseu?因为我的文件包含数千个特殊字符,因此更换每个字符非常繁琐。
谢谢,
答案 0 :(得分:1)
尝试不同的编码。可能是Cp1252
或ISO-8859-1
。您可以在http://www.iana.org/assignments/character-sets中找到更多字符编码(使用首选MIME名称)或查看Character encoding - Wikipedia, the free encyclopedia。
答案 1 :(得分:1)
使用此元标记而不是utf8如果您的网站使用英语,您必须使用多种语言utf8
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-8859-1">