由于我必须多线程,我不能在PHP中雄辩地解决我想用Java编程,遗憾的是我无法找到一个库,这将允许我像PHP简单一样强大,快速,轻松地解析HTML DOM HTML DOM Parser。您是否了解Java中易于使用的替代方案?
答案 0 :(得分:7)
我从简单的HTML DOM Parser转到JSoup,我很满意。
答案 1 :(得分:3)
我可以看到我们在这里面临两个挑战:
答案 2 :(得分:0)
我已成功使用TagSoup作为SAX解析器来填充DOM4J文档,然后我使用XPath进行查询。我花了一段时间才弄清楚咒语 - (Scala,但我确信你可以转换):
parserFactory = new org.ccil.cowan.tagsoup.jaxp.SAXFactoryImpl
val reader = new SAXReader(parserFactory.newSAXParser.getXMLReader)
val doc = reader.read(new InputSource(new StringReader(page)))