Java屏幕抓取,如何从重定向发布请求获得响应

时间:2013-02-15 17:04:56

标签: java screen-scraping jsoup

我只是用java试验数据提取的东西,在这个论坛中搜索,发现它被称为屏幕抓取。我一直在为java寻找屏幕刮刀库,并找到JSoup来解析结果。

我的问题是在提交搜索表单时使用post方法的目标网站,它不容易重新生成它,我也检查chrome中的开发人员工具,提交操作后的响应代码为302并重定向到某个页面然后重定向再次到结果页面。

请有人给我一个提示或指向我如何使用jsoup进行教程。 在我的情况下,我尝试从ai * ras * ia。* com

中检索航班时刻表

1 个答案:

答案 0 :(得分:0)

在JSOUP中有一个名为.followRedirects(followRedirects)的函数,它为你提供了如果你想要遵循重定向的选项,默认情况下它被设置为“true”。

这是允许重定向的HTTP代码:

  • 301 - HTTP_MOVED_PERM
  • 302 - HTTP_MOVED_TEMP
  • 303 - HTTP_SEE_OTHER