我正在使用HTMLUnit来抓取页面,我的日志不断被HTMLUnit输出混乱。即如果它返回403状态代码,它会将整页HTML发送到日志。
我尝试了以下方法将其推迟:
System.getProperties().put("org.apache.commons.logging.simplelog.defaultlog", "fatal");
webClient.setThrowExceptionOnFailingStatusCode(false);
不幸的是,没有任何影响,我的日志仍然看起来像一团糟。我的项目使用log4j,但我没有以任何方式配置HTMLUnit来使用它。
答案 0 :(得分:3)
尝试添加此内容:
webClient.setPrintContentOnFailingStatusCode(false);
我通常也会添加这个:
System.setProperty("org.apache.commons.logging.Log", "org.apache.commons.logging.impl.SimpleLog");
System.setProperty("org.apache.commons.logging.simplelog.defaultlog", "fatal");
答案 1 :(得分:0)
实际上没有方法webClient.setPrintContentOnFailingStatusCode
相反,你应该使用:
webClient.getOptions().setPrintContentOnFailingStatusCode(false);