使用jsoup获取标记后的某些文本

时间:2014-01-18 14:48:49

标签: html text tags jsoup

您好我正在尝试使用jsoup从HTML文件中获取某些文本。我已经知道如何获取text2和text3。但是如何在没有其他人的情况下获得我想要的文字?

<div class="snt"> text I want  
<br clear="both" />text2  
<br clear="both" />text3  
<br clear="both" />  
</div>    

我尝试使用

Elements lines = doc.select(".snt");
lines.First().nextSibling().toString();    

但我一无所获。我也尝试过:

Elements lines = doc.select(".snt");  
lines.text(); // this return all texts together       
你能帮帮我吗?谢谢你的回答。

1 个答案:

答案 0 :(得分:2)

如果您为第一个元素尝试ownText(),您将获得“text I want text2 text3”,这是正确的。你想要br之前的文本,这是你的第一个元素下的第一个子节点。 Jsoup将文本作为节点处理。

Elements lines = doc.select(".snt");
System.out.println(lines.first().childNodes().get(0));