已解析页面的HTML

时间:2010-10-04 12:52:14

标签: java parsing cobra

我正在使用Cobra解析引擎,我希望获得已经解析过的页面的HTML代码(例如,在执行javascripts之后)。有可能吗?如果需要,可以用另一个开源的Java Web解析器替换Cobra。

1 个答案:

答案 0 :(得分:2)

哇,眼镜蛇实际上似乎是这么做的:Example of Usage

它实际上为您提供了一个HTML DOM节点树。如果您愿意,可以使用HTMLWriter来获取HTML文本,但如果您对它的某些特定部分感兴趣,请使用XPath,它比在HTML字符串中搜索更清晰。