在Java代码中通过id查找html元素

时间:2011-12-15 16:50:16

标签: java jquery expression

我想知道是否有人有任何经验以高性能方式检索给定字符串html的元素的经验。我正在编写一个带有两个参数的方法:

public String getFilteredHtml(String html, Set<String> ids)

该方法将返回与传入的id匹配的元素的连接html。目前我使用JSoup通过将html解析为文档来完成此操作,并循环遍历id并附加document.getElementById的结果,或者使用看起来像[id=id1],[id=id2]等的选择器,它在两者之间具有相当的性能。

但是我不禁注意到,如果在解析html文档时,包含String id&gt;的地图元素保持查找会更快。有没有人知道有这个功能的库,或者自己实现它的方法?或者其他任何可能更快完成此任务的方式?

1 个答案:

答案 0 :(得分:0)

您可以使用基于SAX的HTML解析器,并在解析文档时构建您的地图。例如NekoHTMLTagSoup之类的内容。我不确定它会多快多少,你必须进行基准测试。