Jtidy - 不应在页面源代码中显示TM的编码字符(<sup>¢)?</sup>

时间:2013-04-16 02:30:27

标签: tidy htmltidy jtidy

我正在使用Jtidy来提供新闻信息,当新闻信息中有TM时,页面来源显示为

'â''这是无效的......

这是我的代码:

InputStream is = new ByteArrayInputStream(description.getBytes());         OutputStream os = new ByteArrayOutputStream();

    Tidy tidy = new Tidy(); 

    tidy.setPrintBodyOnly(true);
    //tidy.setEscapeCdata(true);
    //tidy.setAsciiChars(false);

任何想法如何显示TM代替这个编码字符.... 或者如何设置(ISO-8859-1)到Tidy?

2 个答案:

答案 0 :(得分:0)

有一个HTML实体,不用太令人惊讶地称为&trade; - 请参阅例如http://www.w3.org/TR/WD-entities-961125

答案 1 :(得分:0)

通过在Tidy上设置setInputEncoding()和setOutputEncoding()来解决它...