标签: java http
我可以使用Java获取整个网页,包括CSS和图像吗?这基本上是在浏览器中使用“另存为”操作时发生的情况。我可以使用任何免费的第三方库。
编辑:
HtmlUnit库似乎正在做我需要的东西。这是我用它来抓取整个网页的方式:
WebClient webClient = new WebClient(); HtmlPage page = webClient.getPage(new URL("...")); page.save(new File("..."));
答案 0 :(得分:1)
Java有一些内置函数可用于打开流,外部源称为Web服务器,并请求一个页面,该页面将返回页面的源。然后,您需要解析外部图像和css和请求的链接,并相应地保存它们。
here是指向作为网站的外部来源打开流的示例的链接
答案 1 :(得分:0)
也许lobo浏览器会帮助您。它是一个完全由java开源的免费浏览器。它有一些可以添加到项目中的jar库。