防止HtmlUnit 2.13执行JavaScript

时间:2013-11-18 10:52:13

标签: java javascript html htmlunit

以下是我获取该页面的代码:

WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage(url);

问题是webClient总是自动执行javascript并向我抛出一个错误列表。我只想获得原始资源。如何防止它执行脚本?我发现版本2.9中有一种方法:

webClient.setJavaScriptEnabled(false);

setJavaScriptEnabled()函数已被弃用。谁知道如何解决这个问题?请帮我。非常感谢你。

1 个答案:

答案 0 :(得分:19)

虽然{@ 1}}已被弃用,但它已添加到setJavaScriptEnabled(boolean)的{​​{1}}成员中。这是doc

要禁用JavaScript,您应该这样做:

WebClientOptions

此外,如果您想从网页上获取原始HTML代码,您应该看一下这个问题:

How to get the pure raw HTML of a page in HTMLUnit while ignoring JavaScript and CSS?

考虑到即使是WebClient方法也会更改格式以及您获取的网页内容(即使禁用了JavaScript)。