使用JSoup提取HTML表格内容

时间:2011-11-22 04:47:28

标签: jsoup

如何提取位于以下位置的表格内容: /id/2/year/2012/acc-conference">http://espn.go.com/mens-college-basketball/conferences/standings//id/2/year/2012/acc-conference

我见过的几个例子并不清楚如何获取表格的内容。任何人都可以提供任何帮助吗?

1 个答案:

答案 0 :(得分:16)

你现在可能已经解决了这个问题,但这会解决每个表并打印出团队名称和赢/输列。根据您需要的信息进行调整。第二个表的格式显然不同,因此如果您需要该表中的不同信息,则必须进一步调整。如果您需要更多帮助,请告诉我。

    Document doc = Jsoup.connect("http://espn.go.com/mens-college-basketball/conferences/standings/_/id/2/year/2012/acc-conference").get();

    for (Element table : doc.select("table.tablehead")) {
        for (Element row : table.select("tr")) {
            Elements tds = row.select("td");
            if (tds.size() > 6) {
                System.out.println(tds.get(0).text() + ":" + tds.get(1).text());
            }
        }
    }