如何使用java和jsoup获取<span>标记中的文本知道其ID?</span>

时间:2013-09-30 10:10:59

标签: java html parsing jsoup

即可获取标签内的文字。我知道它的id,即“lblCompra”和“lblVenta”。

    Document doc = Jsoup.connect("http://www.bccr.fi.cr//").get();
    Element compra = doc.getElementById("lblCompra");
    Element venta = doc.getElementById("lblVenta");   
    System.out.println(compra);
    System.out.println(venta);

但我得到的是一堆我不需要的文字。这是输出:

<span id="lblCompra"> <img src="images/waiting.gif" alt="cargando" /> </span>
<span id="lblVenta"> <img src="images/waiting.gif" alt="cargando" /> </span>

我应该得到的是“400.0”和“450.0”之类的东西。

3 个答案:

答案 0 :(得分:2)

为了获取元素的文本值,请尝试使用text()方法:

System.out.println(compra.text());

更新:您要查找的值由JavaScript加载。 请参阅此topic

答案 1 :(得分:0)

如果您使用getElementById()...您将获得该元素。现在你有了元素从元素中获取值。使用getValue()方法获取值

答案 2 :(得分:0)

也许doc.getElementById("#lblCompra").innerHTML可行吗?

或者如果你想获得img的宽度和高度,你可以这样做:

doc.getElementById('#lblCompra').getElementsByTagName('img')[0].width;