以下是我获取该页面的代码:
WebClient webClient = new WebClient();
HtmlPage page = webClient.getPage(url);
问题是webClient
总是自动执行javascript并向我抛出一个错误列表。我只想获得原始资源。如何防止它执行脚本?我发现版本2.9中有一种方法:
webClient.setJavaScriptEnabled(false);
但setJavaScriptEnabled()
函数已被弃用。谁知道如何解决这个问题?请帮我。非常感谢你。
答案 0 :(得分:19)
虽然{@ 1}}已被弃用,但它已添加到setJavaScriptEnabled(boolean)
的{{1}}成员中。这是doc。
要禁用JavaScript,您应该这样做:
WebClientOptions
此外,如果您想从网页上获取原始HTML代码,您应该看一下这个问题:
How to get the pure raw HTML of a page in HTMLUnit while ignoring JavaScript and CSS?
考虑到即使是WebClient
方法也会更改格式以及您获取的网页内容(即使禁用了JavaScript)。