Java JSOUP lib(1.6.3)删除<style>标记

时间:2015-08-22 12:01:20

标签: java jsoup

我正在使用JSOUP删除不需要的标签。我将 style 标记添加到白名单中,但它删除了该内容!为什么

&#XA;&#XA;

原件:?

&#XA;&#XA;
 <代码>&LT; HTML&GT;&LT; HEAD&GT;&LT;风格&GT;体{height:100%; color:#333333; font-size:8pt; font-family:Arial;}&lt; / style&gt;&lt; / head&gt;&lt; body&gt;&lt; div dir =“rtl”&gt;&lt; style&gt; body {background:black;}&#xA;&lt; / style&gt;&#xA;&lt; p&gt;&lt; span style =“background-color:#FFFF00”&gt; bhkgkhgkhghkgkgkg&lt; / span&gt;&lt; / p&gt ;&#xA;&lt; / div&gt;&lt; / body&gt;&lt; / html&gt;&#xA;  
&#xA;&#xA;

清洁后:

&#xA;&#xA;
 &lt; html&gt;&lt; head&gt;&lt; style&gt;&lt; / style&gt;&lt; / head&gt;&lt; body&gt;&lt; div dir =“rtl”&gt; &lt; style&gt; body {background:black;}&#xA;&lt; / style&gt;&#xA;&lt; p&gt;&lt; span style =“background-color:#FFFF00”&gt; bhkgkhgkhghkgkgkg&lt; / span&gt;&lt; / p为H.&#XA;&LT; / DIV&GT;&LT; / BODY&GT;&LT; / HTML&GT;&#XA;  
&#XA;&#XA;

代码:

&#xA;&#xA;
 白名单myWhite =新白名单()&#xA; .addTags(&#xA;“a”,“b”,“blockquote”,“br”,“caption”,“cite”,“code”,“col”,&#xA;“colgroup”,“dd” ,“div”,“dl”,“dt”,“em”,“h1”,“h2”,“h3”,“h4”,“h5”,“h6”,&#xA;“i”,“ img“,”li“,”ol“,”p“,”pre“,”q“,”small“,”strike“,”strong“,&#xA;”sub“,”sup“,”table“ ,“t”,“td”,“tfoot”,“th”,“thead”,“tr”,“u”,&#xA;“ul”,“font”,“span”,“hr”,“表单“,”输入“,”选项“,”选择“,”textarea“,”样式“)&#xA;&#xA;字符串安全= Jsoup.clean(unSafe,myWhite);&#xA;  
&#XA;

1 个答案:

答案 0 :(得分:0)

实际上,问题与其版本有关,我可以通过将其版本升级到(1.8.3)来解决这个问题;