我有一个包含这样的表的页面:
<html>
<ol>
<li>entry1</li>
<li>entry2</li>
<li>entry3</li>
<li>entry4</li>
</ol>
</html>
我现在想要计算页面上“条目”的出现次数,并且还要提取它每个放置的表格的哪一行(这里是第1行)。
有没有java工具来完成这项任务?为了搜索计数,我会使用RegEx和Matcher模式。 但是,我怎样才能最好地从该文档中提取表格行?
答案 0 :(得分:2)
您可以使用JSoup,使用它从HTML中提取信息非常容易。
答案 1 :(得分:0)
或者,如果您不想使用其他库,则可以使用正则表达式http://www.w3schools.com/jsref/jsref_obj_regexp.asp