我正在尝试解析足球统计网站的结果,并建立一个数据库。
我正在使用jsoup库,我有这个代码,昨天另一个用户为我写的。
我正在尝试解析的页面是这样的: goalnow
我正在使用此代码:
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;
public class HTMLParser {
public static void main(String[] args) throws IOException{
String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();
Elements stats = document.select("#Table3 tbody tr ");
for(int i = 0; i < stats.size(); i++){
System.out.println(stats.get(i).text());
}
}
}
我正在寻找输出中的所有表格,但我是这样的:
基本上,第一行。我的代码出了什么问题?有人可以帮我理解如何解析这类数据吗?没有。日期主页得分远离数据的上下障碍 FT HT FT HT
答案 0 :(得分:0)
您的代码没问题,问题是:网站使用 JavaScript 作为内容。不幸的是,JSoup不支持JS。
第一行被解析,因为它是常见的Html。顺便说一句。检查Jsoup如何看待网站总是有帮助的:
String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();
System.out.println(document);
但你可以在这里查看我的答案:Trying to parse html hidden by javascript
我列出了一些可以帮助你的JavaScript库。