如何使用jSoup获取嵌套元素?

时间:2018-08-27 23:51:22

标签: java jsoup

我正在尝试从http://folkets-lexikon.csc.kth.se/folkets/#lookup&dricker&0访问嵌套类gwt-HTML,该嵌套类包含以下文本:

  

Böjningar:Drack,druckit,drick,dricka,dricker

有关上述站点的一些快速,相关信息:这是一本英语-瑞典语词典,我所需要做的只是每次对URL稍加修改,然后获取Böjningar单词后的文本,在这种情况下,我会得到“ drack,druckit,drick,dricka,dricker”

这是我到目前为止尝试过的

Document document = Jsoup.connect("http://folkets-lexikon.csc.kth.se/folkets/#lookup&dricker&0").get();
Elements elements = document.getElementsByClass("gwt-HTML");
if(!elements.isEmpty()){
    for(Element element: elements){
        System.out.println(element.data());
    }
} else {
    System.out.println("***********NO RESULTS !!!");
}

使用上面的代码,即使检查站点的元素时,我仍然可以看到else语句

<div class="gwt-HTML">Böjningar: drack, druckit, drick, dricka, dricker</div>

我如何获得对该元素的访问权限?

这是数据的屏幕截图 enter image description here

1 个答案:

答案 0 :(得分:0)

使用select("div.gwt-HTML")代替getElementsByClass("gwt-HTML")

Document document = Jsoup.connect("http://folkets-lexikon.csc.kth.se/folkets/#lookup&dricker&0").get();
Elements elements = document.select("div.gwt-HTML");
if(!elements.isEmpty()){
    for(Element element: elements){
        System.out.println(element.data());
    }
} else {
    System.out.println("***********NO RESULTS !!!");
}