如何使用java只获得有效的htmlContent?

时间:2016-04-12 10:49:11

标签: java html html5 validation

我正在寻求帮助:

如何才能从给定的" htmlContent"中获取有效的HTML。作为String对象?

示例....我的htmlContent看起来像....

<p>   some.   
         <b> some text</b>  
         text
</p>

</span>
</strong>
</p>

正如你所看到的,我有最后三个孤儿html标签必须消失,返回值只会是:

<p>   some.   
         <b> some text</b>  
         text
</p>

有没有办法让我得到如上所述的预期结果?

我正在处理那些有大量问题的html文档,我需要清理它。

非常感谢您的帮助。

0 个答案:

没有答案