标签: java html parsing html-content-extraction
我想解析一些HTML,以便找到某些属性/标签等的值。
您推荐哪些HTML解析器?有什么优点和缺点?
答案 0 :(得分:12)
NekoHTML,TagSoup和JTidy将允许您解析HTML,然后使用XML工具进行处理,例如XPath。
答案 1 :(得分:7)
我尝试了HTML Parser这很简单。
答案 2 :(得分:1)
您是否需要对HTML进行全面解析?如果你只是在内容中寻找特定的值(一个特定的标签/参数),那么一个简单的正则表达式就足够了,而且可能更快。