如何使用jsoup获取不属于任何元素的文本?

时间:2015-03-25 08:48:16

标签: java parsing html-parsing jsoup

如何获取不属于任何元素的文本?

<br><b>Price:</b> &nbsp; Rs. 24,900.00 &nbsp; <br>

在这里,如何获得文本Rs.24,900.00。这可能是使用jsoup吗?

1 个答案:

答案 0 :(得分:1)

我想有一个父元素,所以你应该首先选择它,然后选择“b”,就像下面的代码一样。基本上只需在文本前面找到元素。

Document doc = Jsoup.parse( "<br><b>Price:</b> &nbsp; Rs. 24,900.00 &nbsp; <br>");
Element el = doc.select("b").first();
String text = ((TextNode) el.nextSibling()).text();

我首先使用,因为我从你的例子中知道只有一个“b”元素。如果您有多个价格,则必须迭代所有元素而不是先使用。

Jsoup将文本存储为节点。因此nextSibling将返回一个跟在“b”元素之后的节点(TextNode)并包含文本值:“Rs.24,900.00”