我正在使用jsoup,整理一些html非常好,但我有一段无效的html如下:
<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss
我想得到的是:
<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p>
那么jsoup能够整理html并返回此输出吗?
感谢
答案 0 :(得分:9)
是的,试试这个:
String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss";
String clean = Jsoup.clean(html, Whitelist.relaxed());
您也可以使用其他Whitelist。