机械化将登录表单从http提交到https

时间:2009-12-08 13:13:03

标签: python forms post https mechanize

我有一个网页,其中包含通过HTTP加载的登录表单,但它通过HTTPS提交数据。

我正在使用python-mechanize登录此站点,但似乎数据是通过HTTP提交的。

我的代码如下所示:

import mechanize
b = mechanize.Browser()
b.open('http://site.com')
form = b.forms().next()  # the login form is unnamed...
print form.action        # prints "https://login.us.site.com"
form['user'] = "guest"
form['pass'] = "guest"
b.form = form
b.submit()

提交表单时,连接是通过HTTP进行的,包含以下内容:

send: 'POST https://login.us.site.com/ HTTP/1.1\r\nAccept-Encoding: identity\r\nContent-Length: 180\r\nHost: login.us.site.com\r\nContent-Type: application/x-www-form-urlencoded\r\n\r\n'...

任何人都可以确认并最终发布解决方案,以便通过HTTPS提交表单吗?

稍后编辑:

1)我正在使用HTTP代理进行http / https流量(在环境中设置 - Linux机器)
2)我用Wireshark观察了流量,我可以确认流量是通过普通HTTP发送的(我可以看到POST的内容,机械化不会像webbrowser那样向代理发送相同的请求 - 后者发送连接login.us.site.com:443,同时仅机械化POST https://login.us.site.com)。但是,我不知道数据离开代理时会发生什么;也许它建立了与目标站点的ssl连接?

2 个答案:

答案 0 :(得分:2)

mechanize在内部使用urllib2,后者有一个错误:HTTPS over (Squid) Proxy fails。该错误已在Python 2.6.3中修复,因此更新Python应该可以解决您的问题。

答案 1 :(得分:1)