使用jsoup删除两个标记之间的html文本

时间:2012-11-30 15:59:01

标签: java html-parsing jsoup

我想以递归方式删除两个标记之间的HTML文本,例如<bloquotes>

对于这个例子:

<div>hfhfk
<bloquotes><bloquotes>ppppp</bloquotes>fin texte </bloquotes>
</div>

我想得到以下结果:

<div>hfhfk</div>

2 个答案:

答案 0 :(得分:1)

使用jQuery你可以这样做:

$("bloquotes").each(function(){
       $(this).html("");
});
$("bloquotes").remove();

答案 1 :(得分:1)

你在这里:

String html = "<div>hfhfk<bloquotes><bloquotes>ppppp</bloquotes>fin texte </bloquotes></div>";
Document doc = Jsoup.parse(html);

Elements source = doc.select("div");
Element element = (Element) source.get(0);
Node result = element.childNode(0);
String nodeResult = result.toString().trim();

System.out.println(nodeResult + "");
System.out.println(nodeResult.length() + "");