在Java中检索网页的DOM视图而不仅仅是Source

时间:2012-01-25 23:24:48

标签: java html dom

是否可以获取页面的Dom视图,例如,当您单击inspect元素时,与查看源相比,您在chrome中看到的内容。我需要通过java访问它,目前我可以获得源代码。

谢谢你们。

2 个答案:

答案 0 :(得分:0)

恕我直言,你也必须按照链接...所以一旦你有源,你需要解析它。然后,您可以在原始DOM中插入链接的内容(如CSS或脚本)。

答案 1 :(得分:0)

HTML可能很乱。在过去,我使用TagSoup来解析HTML并以SAX事件流的形式生成XML,然后使用JDOM构建XML的内存类DOM树版本,效果很好。然后,您可以使用其他库(如Saxon)对该XML树执行xpath,xslt或xquery。