您好我正在尝试使用jsoup从HTML文件中获取某些文本。我已经知道如何获取text2和text3。但是如何在没有其他人的情况下获得我想要的文字?
<div class="snt"> text I want
<br clear="both" />text2
<br clear="both" />text3
<br clear="both" />
</div>
我尝试使用
Elements lines = doc.select(".snt");
lines.First().nextSibling().toString();
但我一无所获。我也尝试过:
Elements lines = doc.select(".snt");
lines.text(); // this return all texts together
你能帮帮我吗?谢谢你的回答。
答案 0 :(得分:2)
如果您为第一个元素尝试ownText(),您将获得“text I want text2 text3”,这是正确的。你想要br之前的文本,这是你的第一个元素下的第一个子节点。 Jsoup将文本作为节点处理。
Elements lines = doc.select(".snt");
System.out.println(lines.first().childNodes().get(0));