使用Java或Javascript从html中提取表

时间:2013-07-29 12:12:13

标签: javascript java html-table html-content-extraction

我有一个名为page1.html,page2.html的html文件。在page1.html和page2.html中,我在table元素中有一些内容,现在我想提取这些表内容并将其放在名为summary.html的新文件中。我不知道jQuery,所以如何从Java或Javascript中做到这一点。我知道如何从Java / Javascript创建html。

1 个答案:

答案 0 :(得分:0)

如果使用Java,我能想到的最佳选择是使用{HTML}解析器库JSOUP

File input = new File("C:\\page1.html");
Document doc = Jsoup.parse(input, "UTF-8");

Element table = doc.getElementByTag("table");
Elements rows = table.getElementsByTag("tr");
for (Element row : rows) {
  String rowText = row.text();
}