使用HtmlUnit获取页面的资源

时间:2016-10-05 10:52:54

标签: java html-parsing htmlunit

如何获取页面加载的所有资源的“绝对URL”和“文件”?

当我在变量page中有HtmlPage对象时,page.save(new File(path));会保存资源。如果我保存这样的资源,我只有文件而不是相应的URL。

1 个答案:

答案 0 :(得分:0)

在以下帮助下解决了这个问题: https://stackoverflow.com/a/31261340/3634099

@Override
public WebResponse getResponse(WebRequest request) throws IOException {
 WebResponse response = super.getResponse(request);
 request.getUrl()
 request.getUrl().getPath();
 request.getUrl().getFile();
 return response;
}