Question

我正在尝试解析足球统计网站的结果，并建立一个数据库。

我正在使用jsoup库，我有这个代码，昨天另一个用户为我写的。

我正在尝试解析的页面是这样的： goalnow

我正在使用此代码：

import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.*;
import org.jsoup.select.Elements;

public class HTMLParser {

public static void main(String[] args) throws IOException{
 String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

Elements stats = document.select("#Table3 tbody tr ");

for(int i = 0; i < stats.size(); i++){
    System.out.println(stats.get(i).text());
}

  }
}

我正在寻找输出中的所有表格，但我是这样的：

没有。日期主页得分远离数据的上下障碍 FT HT FT HT

基本上，第一行。我的代码出了什么问题？有人可以帮我理解如何解析这类数据吗？

Answer 1

您的代码没问题，问题是：网站使用 JavaScript 作为内容。不幸的是，JSoup不支持JS。

第一行被解析，因为它是常见的Html。顺便说一句。检查Jsoup如何看待网站总是有帮助的：

String url = "http://info.nowgoal.com/en/League.aspx?SclassID=34&MatchSeason=2007-2008";
Document document = Jsoup.connect(url).get();

System.out.println(document);

但你可以在这里查看我的答案：Trying to parse html hidden by javascript

我列出了一些可以帮助你的JavaScript库。

通过页面解析不期望输出

1 个答案: