Jsoup.connect无法获得正确的html内容

时间:2014-03-11 14:49:08

标签: java jsoup connect

我使用Jsoup从网站中提取指定数据

try{
   Document doc = Jsoup.connect("http://example/search/").get();
} catch(IOException){
  System.out.println("error");
}

但是我失败了,输出是“错误”。

当我使用Mozilla或其他浏览器浏览时,此地址已成功加载。 有什么想法吗?请帮帮我..

祝你好运

1 个答案:

答案 0 :(得分:1)

如果您显示IOException消息中的异常消息,您将看到

  

org.jsoup.HttpStatusException:HTTP错误提取URL。状态= 500,URL = ...

解决方案:您需要将用户代理设置为与移动网站

对应
Document doc = 
     Jsoup.connect("http://m.tokobagus.com/search/province").userAgent
      ("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.2 (KHTML, like Gecko)          
        Chrome/15.0.874.120 Safari/535.2").get();

更重要的是,请记住显示这些异常消息:

} catch(IOException ioe){
  ioe.printStacktrace();
}