使用JSoup清理html时保持样式

时间:2014-01-24 06:07:01

标签: java html jsoup

我是JSoup的新手。而且,我使用以下代码来清理html:

    String clean = Jsoup.clean(html, Whitelist.relaxed());

我得到了所需的html,但缺少所有样式,如粗体,斜体等。

如何使用JSoup维护html代码及其各自的样式? 如果还有其他图书馆这样做,请推荐一个?

1 个答案:

答案 0 :(得分:1)

使用Jsoup.clean(html, Whitelist.relaxed())时,

Whitelist.relaxed()

直接来自文档,

  

此白名单允许全方位的文本和结构体HTML:a,b,blockquote,br,caption,cite,code,col,colgroup,dd,dl,dt,em,h1,h2,h3,h4, h5,h6,i,img,li,ol,p,pre,q,small,strike,strong,sub,sup,table,tbody,td,tfoot,th,thead,tr,u,ul

如果你想允许更多的元素(即样式属性)将它们添加到Whitelist实例以允许它通过它。您可以使用Whitelist API中的以下方法

addTags(java.lang.String...)
addAttributes(java.lang.String, java.lang.String...)

请阅读JSOUP库中的Whitelist文档。