抓取HTML表格数据

时间:2013-07-05 10:27:35

标签: java html

我可以使用其他网站(javascript)或java程序从HTML网站的表格中获取数据吗?

例如

我有一个名为

的表

学生

ID NAME
1   Carlo

更新

我想在java中创建一个读取html网站并获取一些数据的代码。

2 个答案:

答案 0 :(得分:3)

我使用HtmlUnit来阅读分析网站。它还可以在网站上处理javascript。

您可以搜索所需的html标记,例如id或xpath。或者你遵循页面的html hirarchical结构

答案 1 :(得分:1)

you can also use HTML Parsers linke [jsoup][1] to get the details of table

public static void getTableDetails()
{
    Document doc = Jsoup.connect("url").get();

    for (Element table : doc.select("table[name="students")) 
    {

     for (Element row : table.select("tr)")) {
        Elements tds = row.select("td");
       System.out.println(tds.get(0).text() + "->" + tds.get(1).text());
     }
}
for循环中的

根据您的要求更改值和位置