标签: java php parsing html-parsing simple-html-dom
我正在寻找java html解析器(我知道java和我的坏php - 这样我想了解html解析器是如何工作的)PHP中的简单html dom。
感谢
答案 0 :(得分:3)
试试jsoup。据我所知,它是最好的HTML解析器。
答案 1 :(得分:1)
尝试TagSoup,这是一个SAX解析器,它接收真实的混乱HTML并触发ContentHandler上的SAX XML事件。我建议使用JDOM来构建可以手动或通过XPath行走的JDOM文档。