如何从URL获取呈现的网页?

时间:2012-07-18 21:14:09

标签: java

我不想只是源代码。我想要渲染的页面。这是一个重要的区别,我显然无法通过简单地搜索谷歌。

有谁知道如何从网址获取呈现的页面?

这需要在Java中完成,希望没有额外的库。

2 个答案:

答案 0 :(得分:0)

您可以尝试使用包装Web浏览器的库,例如Berkelium。如果您需要Java,Google搜索会生成this Java wrapper API for Berkelium(我没有亲自尝试过)。

sites.google使用example

答案 1 :(得分:0)

另一个解决方案是使用HTMLUnit,这是一个“无GUI的JAVA浏览器”。 Google建议您生成基于ajax的网页的快照,以使其可以抓取。