我想将Jsoup从1.7.2更新到1.8.1。 正如更改日志中所宣布的那样,转义行为已发生变化。 在我的应用程序中,我希望转义输出html,无论定义什么字符集。
拥有以下代码:
String test = "äöüèéàÄÖÜÀÉÈ\"&°";
Document document = Jsoup.parseBodyFragment(test);
System.out.println(document.body().html());
1.7.2输出:
&安培; AUML;&安培; ouml;&安培; uuml;&安培; egrave;&安培; eacute;&安培; agrave;&安培; AUML;&安培; Ouml;&安培; Uuml;&安培; Agrave;&安培; Eacute;&安培; Egrave ;&安培; QUOT;&放大器;放大器;&安培;度;
1.8.1输出:
äöüèéàÄÖÜÀÉÈ\“&安培;°
恢复1.7.2行为的最佳方法是什么? 我尝试将字符集设置为ASCII:
document.outputSettings().charset(Charset.forName("ASCII"));
但是引号不会被转义,也许还有其他字符......