从html表中提取特定信息?

时间:2012-11-23 13:00:32

标签: javascript html

我有一个包含这样的表的页面:

<html>
<ol>
<li>entry1</li>
<li>entry2</li>
<li>entry3</li>
<li>entry4</li>
</ol>   
</html>

我现在想要计算页面上“条目”的出现次数,并且还要提取它每个放置的表格的哪一行(这里是第1行)。

有没有java工具来完成这项任务?为了搜索计数,我会使用RegEx和Matcher模式。 但是,我怎样才能最好地从该文档中提取表格行?

2 个答案:

答案 0 :(得分:2)

您可以使用JSoup,使用它从HTML中提取信息非常容易。

答案 1 :(得分:0)

或者,如果您不想使用其他库,则可以使用正则表达式http://www.w3schools.com/jsref/jsref_obj_regexp.asp