Jsoup仅提取此标记

时间:2014-07-11 14:55:13

标签: java jsoup

我有这个HTML代码:code html

我只想要" a"标签包含在" td"标签

我试过了:

    Elements tables = body.getElementsByTag("table");

    for (Element table : tables) {

        if (table.className().toLowerCase().contains("infobox")) {

            Elements link=table.getElementsByTag("a");

            for(Element el:link)
                System.out.println(el.text());


            break;
        }

}

但是它会提取标签" a" " th"和" td"虽然我只想要标签" a" " td"。 谢谢。

修改 我这样解决了:

Elements tables = body.getElementsByTag("table");

    for (Element table : tables) {

        if (table.className().toLowerCase().contains("infobox")) {


            Elements t1 = table.select("td");
            Elements t2 = t1.select("a");

            for(Element el:t2)
                System.out.println(el.text());


            break;
        }

}

1 个答案:

答案 0 :(得分:0)

或者你可以做到简单

for(Element e : doc.select("table.infobox td a")){
    System.out.println(e.text());
}