从网页获取数据到表格中

时间:2014-10-16 09:56:39

标签: java web-scraping

我希望从http://www.sportinglife.com/greyhounds/abc-guide获取数据并将其插入Java中的表中。正如您在网页上看到的那样,已经有一个包含两个列的表,狗名和种族。这就是我想在我的Java程序中复制,然后使用JavaFX将表输出到表视图。

您建议使用Java的最佳方法是什么?

1 个答案:

答案 0 :(得分:0)

您需要从网页上读取HTML,然后解析HTML DOM以获取表格数据

String url = "http://www.sportinglife.com/greyhounds/abc-guide";
URL obj = new URL(url);
HttpURLConnection con = (HttpURLConnection) obj.openConnection();

// optional default is GET
con.setRequestMethod("GET");

//add request header
con.setRequestProperty("User-Agent", USER_AGENT);

int responseCode = con.getResponseCode();
System.out.println("\nSending 'GET' request to URL : " + url);
System.out.println("Response Code : " + responseCode);

BufferedReader in = new BufferedReader(
new InputStreamReader(con.getInputStream()));
String inputLine;
StringBuffer response = new StringBuffer();

while ((inputLine = in.readLine()) != null) {
    response.append(inputLine);
}
in.close();
//print result
System.out.println(response.toString());

对于解析,您可以参考Java HTML Parsing