页面内脚本的htmlunit 404错误

时间:2011-03-09 00:56:02

标签: java screen-scraping web-scraping htmlunit

我正在使用htmlunit尝试打开一个网站,但我一直收到404错误。该网站在我的python脚本和我的浏览器中工作,但由于某种原因不在html单元中。我认为我的网址本身很好,但似乎是在网站内打开另一个网站而失败了(example.com/SharedResources/Default/js/coda_bubble/jquery.codabubble.js)

对于熟悉htmlunit的人,有没有办法让它不自动加载网站的其他区域?或者更优雅地处理网站上的错误?

非常感谢。

1 个答案:

答案 0 :(得分:3)

对不起发帖而不研究很重。我无法理解,一位精明的编程朋友向我指出了api,并阻止了我必须提出的错误:

webclient.setThrowExceptionOnFailingStatusCode(False)

起初我遇到了一些问题,但在我把F大写为False之后,它就成功了。展示我对编程的新兴。

谢谢大家,我希望它有所帮助!