我正在寻求帮助:
如何才能从给定的" htmlContent"中获取有效的HTML。作为String对象?
示例....我的htmlContent看起来像....
<p> some.
<b> some text</b>
text
</p>
</span>
</strong>
</p>
正如你所看到的,我有最后三个孤儿html标签必须消失,返回值只会是:
<p> some.
<b> some text</b>
text
</p>
有没有办法让我得到如上所述的预期结果?
我正在处理那些有大量问题的html文档,我需要清理它。
非常感谢您的帮助。