通过页面解析不期望输出

时间:2013-05-29 14:58:05

标签: java database parsing jsoup

我正在尝试解析足球统计网站的结果,并建立一个数据库。

我正在使用jsoup库,我有这个代码,昨天另一个用户为我写的。

我正在尝试解析的页面是这样的: goalnow

我正在使用此代码:

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;

public class HTMLParser {

public static void main(String[] args) throws IOException{
 String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

Elements stats = document.select("#Table3 tbody tr ");

for(int i = 0; i < stats.size(); i++){
    System.out.println(stats.get(i).text());
}

  }
}

我正在寻找输出中的所有表格,但我是这样的:

  

没有。日期主页得分远离数据的上下障碍   FT HT FT HT

基本上,第一行。我的代码出了什么问题?有人可以帮我理解如何解析这类数据吗?

1 个答案:

答案 0 :(得分:0)

您的代码没问题,问题是:网站使用 JavaScript 作为内容。不幸的是,JSoup不支持JS。

第一行被解析,因为它是常见的Html。顺便说一句。检查Jsoup如何看待网站总是有帮助的:

String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

System.out.println(document);

但你可以在这里查看我的答案:Trying to parse html hidden by javascript

我列出了一些可以帮助你的JavaScript库。