用htmlcleaner清理html代码片段而不是整个doc

时间:2015-02-14 17:19:08

标签: htmlcleaner

我正在使用org.htmlcleaner

我正在添加一些用户生成的html并想要清理它。 但当我这样做时:

String signature  = "<div>Some sig</div>
HtmlCleaner cleaner = new HtmlCleaner();
signatureTagNode = cleaner.clean( signature );
SimpleHtmlSerializer htmlSerializer = new SimpleHtmlSerializer(props);
String cleanedHTML = htmlSerializer.getAsString( signatureTagNode );

cleaningHTML添加了body和html标记。是否有不添加这些的旗帜或财产。我在这里找不到他们http://htmlcleaner.sourceforge.net/parameters.php#transform

由于

1 个答案:

答案 0 :(得分:0)

在调用序列化程序之前添加以下内容:

props.setOmitHtmlEnvelope(true);