从html,JSOUP获取tabledata

时间:2013-05-28 16:13:51

标签: html web-scraping jsoup

从网址中提取表中数据的最佳方法是什么?

简而言之,我需要从以下两个表中获取实际数据:http://www.oddsportal.com/sure-bets/

在此示例中,数据将为“Paddy power”和“3.50” 看到这张图片:

(很抱歉发布这样的图片,但我仍需要声望,我稍后会修改) http://img837.imageshack.us/img837/3219/odds2.png

我尝试过Jsoup,但我不知道这是不是最好的方法? 而且我似乎无法在桌面上正确导航,我尝试过这样的事情:

    tables = doc.getElementsByAttributeValueStarting("class", "center"); 
    link = doc.select("div#col-content > title").first();
    String text1 = doc.select("div.odd").text();

表格似乎得到了一些数据,但不包括表格中的文字

1 个答案:

答案 0 :(得分:1)

对不起,伙计。要检索的第二个字段由JavaScript填充。 Jsoup不执行JavaScript。 要选择第一行的标题,您可以使用:

Document doc = Jsoup.connect("http://www.oddsportal.com/sure-bets/").get();
     Elements tables = doc.select("table.table-main").select("tr:eq(2)").select("td:eq(2)");
     System.out.println(tables.select("a").attr("title"));

用于可视化的链选择。