使用Java从特定URL获取整个Web页面

时间:2011-06-24 11:34:04

标签: java http

我可以使用Java获取整个网页,包括CSS和图像吗?这基本上是在浏览器中使用“另存为”操作时发生的情况。我可以使用任何免费的第三方库。

编辑:

HtmlUnit库似乎正在做我需要的东西。这是我用它来抓取整个网页的方式:

WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage(new URL("..."));
page.save(new File("..."));

2 个答案:

答案 0 :(得分:1)

Java有一些内置函数可用于打开流,外部源称为Web服务器,并请求一个页面,该页面将返回页面的源。然后,您需要解析外部图像和css和请求的链接,并相应地保存它们。

here是指向作为网站的外部来源打开流的示例的链接

答案 1 :(得分:0)

也许lobo浏览器会帮助您。它是一个完全由java开源的免费浏览器。它有一些可以添加到项目中的jar库。