使用Java下载带有资源的Web页面

时间:2011-06-07 13:02:57

标签: java web-crawler

是否有任何api可用于捕获整个java页面,就像浏览器另存为一样?

2 个答案:

答案 0 :(得分:0)

我认为在您的情况下模拟浏览器可能是一个简单的解决方案(虽然有点重量级)。查看HtmlUnit

答案 1 :(得分:0)

您可以尝试查看Lobo:http://lobobrowser.org/java-browser.jsp这是一个基于Web的Java浏览器。它们可能为您提供了一种方法,可以使用目录中的资源下载整个页面。 另一种方法可能是使用Selenium之类的东西,并在录制宏转到File - >之后在java应用程序中启动Firefox实例。另存为......等等。