HtmlUnit需要花费大量时间来执行javascript,我想知道是否有可能使HtmlUnit不从url regex过滤器加载javascript。
答案 0 :(得分:2)
不完全是,你不仅可以整体禁用javascript(可能你已经知道了):
final WebClient webClient = new WebClient();
webClient.getOptions().setJavascriptEnable(false);
但您可以使用ScriptPreProcessor javascript,并删除您不想要的内容:
webClient.setScriptPreProcessor(new ScriptPreProcessor() {
@Override
public String preProcess(HtmlPage htmlPage, String sourceCode, String sourceName, int lineNumber, HtmlElement htmlElement) {
if (match...)
return "";
}
});