TagSoup与Jsoup vs. HTML Parser vs. HotSax vs.

时间:2011-03-03 16:45:44

标签: java android html-parsing

可供选择的大量HTML解析器(并坚持使用)令人难以置信:

http://java-source.net/open-source/html-parsers

如何选择最符合以下要求的产品:

  1. 成熟(比其他人更少的错误)
  2. 生活和呼吸(即存在 保持)
  3. 快速且资源效率高 (打算在Android上运行)
  4. 根据您的经验,您会推荐哪种HTML解析器(满足上述要求)以及原因?

1 个答案:

答案 0 :(得分:38)

好吧,我找到了答案,这是@BalusC在different thread上给出的:

  1. 如果您只想使用基于XML的 遍历它的工具:JTidy
  2. 如果您想对HTML进行单元测试: HtmlUnit
  3. 如果您想提取特定数据 来自HTML:Jsoup
  4. 谢谢@BalusC。