我试图通过htmlunit获取this页面的源代码,但似乎某些javascript未被执行(或者可能正在发生其他事情)。它只返回" Loading ..."在表格出现之前显示的阶段。我做错了吗?
我的代码:
[...] WebClient webClient = new WebClient(BrowserVersion.CHROME);
Page page = webClient.getPage(url);
WebResponse response = page.getWebResponse();
String content = response.getContentAsString();
System.out.println("HTML: " + content); [...]
答案 0 :(得分:0)
page。getWebResponse()
返回从服务器收到的响应,无需修改JavaScript。
您应该使用:
page.asXml()
或
page.asText()
对于该页面,HtmlUnit似乎遇到了错误:
com.gargoylesoftware.htmlunit.ScriptException类型的无效JavaScript值