无法从HtmlUnit获取正确的来源

时间:2017-06-02 20:17:41

标签: javascript java htmlunit

我试图通过htmlunit获取this页面的源代码,但似乎某些javascript未被执行(或者可能正在发生其他事情)。它只返回" Loading ..."在表格出现之前显示的阶段。我做错了吗?

我的代码:

[...] WebClient webClient = new WebClient(BrowserVersion.CHROME);
Page page = webClient.getPage(url);
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();
System.out.println("HTML: " + content); [...]

1 个答案:

答案 0 :(得分:0)

page。getWebResponse()返回从服务器收到的响应,无需修改JavaScript。

您应该使用:

page.asXml()

page.asText()

对于该页面,HtmlUnit似乎遇到了错误:

  

com.gargoylesoftware.htmlunit.ScriptException类型的无效JavaScript值