从网址中提取表中数据的最佳方法是什么?
简而言之,我需要从以下两个表中获取实际数据:http://www.oddsportal.com/sure-bets/
在此示例中,数据将为“Paddy power”和“3.50” 看到这张图片:
(很抱歉发布这样的图片,但我仍需要声望,我稍后会修改) http://img837.imageshack.us/img837/3219/odds2.png
我尝试过Jsoup,但我不知道这是不是最好的方法? 而且我似乎无法在桌面上正确导航,我尝试过这样的事情:
tables = doc.getElementsByAttributeValueStarting("class", "center");
link = doc.select("div#col-content > title").first();
String text1 = doc.select("div.odd").text();
表格似乎得到了一些数据,但不包括表格中的文字
答案 0 :(得分:1)
对不起,伙计。要检索的第二个字段由JavaScript填充。 Jsoup不执行JavaScript。 要选择第一行的标题,您可以使用:
Document doc = Jsoup.connect("http://www.oddsportal.com/sure-bets/").get();
Elements tables = doc.select("table.table-main").select("tr:eq(2)").select("td:eq(2)");
System.out.println(tables.select("a").attr("title"));
用于可视化的链选择。