如何在解析HTML时处理重定向? - Python

时间:2010-04-02 20:42:24

标签: python html http forms screen-scraping

我正在尝试通过Python脚本提交一些表单,我正在使用机械化库。

这样我就可以实现临时API。

问题是,在提交之前,会返回一个空白页面,通知正在处理请求,几秒钟后页面将被重定向到最终页面。


我理解这听起来有点普遍,但我不确定发生了什么。 :)

有什么想法吗?

2 个答案:

答案 0 :(得分:2)

传统上当您获得重定向时,响应的状态代码为302,并且有一个位置标头指示浏览器下一步的位置。其他技术(蹩脚)就是将meta refresh tag放在文档的头部。

<meta http-equiv="refresh" content="2;url=http://nextlocation.com">

我想有很多方法可以用javascript(也是蹩脚)

来做到这一点

答案 1 :(得分:1)

如果它使用元标记,那么您需要手动解析HTML。否则,mechanize将自动处理重定向。