Jsoup:1.8.2中的逃逸行为,如1.7.2

时间:2014-10-06 14:30:29

标签: escaping jsoup

我想将Jsoup从1.7.2更新到1.8.1。 正如更改日志中所宣布的那样,转义行为已发生变化。 在我的应用程序中,我希望转义输出html,无论定义什么字符集。

拥有以下代码:

String test = "äöüèéàÄÖÜÀÉÈ\"&°";
Document document = Jsoup.parseBodyFragment(test);
System.out.println(document.body().html());

1.7.2输出:

  

&安培; AUML;&安培; ouml;&安培; uuml;&安培; egrave;&安培; eacute;&安培; agrave;&安培; AUML;&安培; Ouml;&安培; Uuml;&安培; Agrave;&安培; Eacute;&安培; Egrave ;&安培; QUOT;&放大器;放大器;&安培;度;

1.8.1输出:

  

äöüèéàÄÖÜÀÉÈ\“&安培;°

恢复1.7.2行为的最佳方法是什么? 我尝试将字符集设置为ASCII:

document.outputSettings().charset(Charset.forName("ASCII"));

但是引号不会被转义,也许还有其他字符......

0 个答案:

没有答案