我正在使用Jtidy来提供新闻信息,当新闻信息中有TM时,页面来源显示为
'â''这是无效的......
这是我的代码:
InputStream is = new ByteArrayInputStream(description.getBytes()); OutputStream os = new ByteArrayOutputStream();
Tidy tidy = new Tidy();
tidy.setPrintBodyOnly(true);
//tidy.setEscapeCdata(true);
//tidy.setAsciiChars(false);
任何想法如何显示TM代替这个编码字符.... 或者如何设置(ISO-8859-1)到Tidy?
答案 0 :(得分:0)
有一个HTML实体,不用太令人惊讶地称为™
- 请参阅例如http://www.w3.org/TR/WD-entities-961125
答案 1 :(得分:0)
通过在Tidy上设置setInputEncoding()和setOutputEncoding()来解决它...