如何使用jsoup来整理html

时间:2012-07-06 06:38:23

标签: jsoup

我正在使用jsoup,整理一些html非常好,但我有一段无效的html如下:

<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss

我想得到的是:

<p>The recurrence, in close succession </p><ul><li>list item 1</li><li>list item 2</li></ul> <p>second part of thisssss</p>

那么jsoup能够整理html并返回此输出吗?

感谢

1 个答案:

答案 0 :(得分:9)

是的,试试这个:

String html = "<p>The recurrence, in close succession <ul><li>list item 1</li><li>list item 2</li></ul> second part of thisssss";
String clean = Jsoup.clean(html, Whitelist.relaxed());

您也可以使用其他Whitelist