JSOUP。如何在此页面上选择提取数据?

时间:2016-12-11 16:28:45

标签: java jsoup

您好我是新手使用“jsoup” 并试图从这个页面中提取数据但是为了更多,我将“id”和“class”结合起来并没有向我显示任何内容。

enter image description here

代码是这样的:

 Document d = getHtmlDocument("http://www.mismarcadores.com/futbol/inglaterra/league-one/resultados/"); 
 System.out.println("El Status Code  es: "+getStatusConnectionCode("http://www.mismarcadores.com/futbol/inglaterra/league-one/resultados/"));

Elements ele=d.select("#fs-results");
System.out.println("Numero de entradas en la pagina mismarcadores: "+ele.size()+"\n");

如果它提取您的信息,请使用其他页面。

感谢.....

2 个答案:

答案 0 :(得分:0)

我相信你会追求这样的事情:

Element element = d.getElementById("fs-results");

Elements elements = d.getElementsByClass("fs-table");

答案 1 :(得分:0)

包含此页面数据的标记是< div id =“tournament-page-data-results”>。此代码将为您提供该数据。但是,数据的格式对我来说很奇怪,我无法帮助解决这个问题。 有时要查找数据,在浏览器中右键单击页面,“查看源代码”,查看源代码并使用数据识别标记。

Document d = Jsoup.connect(url).get();
//Option 1.
Element element = d.getElementById("tournament-page-data-results");
System.out.println(element.text());
//Option 2 with select.
Elements element2 = d.select("#tournament-page-data-results");
System.out.println(element2.get(0).text());