我正在尝试使用Python requests
API以编程方式模仿网站上的用户操作。
要以编程方式完成此请求,请求必须具有用户/通过身份验证,并且还应将少量NVP作为标头中的Cookie传递。
为了获得NVP,我最初做出一个虚拟请求,服务器返回我的cookie。
我从这些cookie中获取所需的值,并使用它来发送实际请求。
但请求没有成功,服务器抱怨我没有登录。
但是如果我使用浏览器中的cookie值,请求就会成功。
以编程方式获取cookie中的JSESSIONID,glide_user和glide_user_session参数的虚拟请求是
response = requests.get('http://example.com/make_dummy_get',auth=('username','pasword'))
cookie_params = response.cookies.items()
以下是实际请求
headers = {
'Host': 'example.com'
,'Connection': 'keep-alive'
,'Content-Length': 113
,'Cache-Control': 'max-age=0'
,'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8'
,'Origin': 'example.com'
,'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/36.0.1985.125 Safari/537.36'
,'Content-Type': 'application/x-www-form-urlencoded'
,'Referer': 'www.example.com/asdas/'
,'Accept-Encoding': 'gzip,deflate,sdch'
,'Accept-Language': 'en-US,en;q=0.8'
,'Cookie': 'JSESSIONID=B6F7371A11825472CAB0366A4DCDD8EFB; glide_user="SC:Z3Vlc3Q=:b890b38b7f000001121dbe81a08c413ca5"; glide_user_session="SC:Z3Vlc3Q=:b890b38b7f000001121dbe81a08c413ca5"'
}
form_data = {
'param1': 'value1'
,'param2': 'value2'
,'param3': 'value3'
}
res = requests.post('http://example.com/make_post_request',auth=('username','pasword'),data=form_data,headers = headers)
在我看来,由于某种原因我的虚拟请求创建的会话正在关闭 因此第二个请求被拒绝,html响应说我必须登录才能访问所请求的资源。
我使用Java apache的HttpClient进行了相同的练习并以相同的问题结束。我在这里缺少什么来使请求成功而没有任何登录或身份验证问题?
答案 0 :(得分:7)
首先,您应该使用请求中的Session
对象。这将管理cookie(并为您准备),因此您不必为自己创建cookie标题。
s = requests.Session()
s.get('http://example.com/make_dummy_get',auth=('username','pasword'))
print(s.cookies)
接下来我必须强烈建议您停止设置以下标题:
Host
Content-Length
Content-Type
Cookie
所有这四个标题都将由requests
为您生成。 Cookie
标头将使用CookieJar
使用的Session
生成。 Content-Length
和Content-Type
将在requests
准备身体时计算。
此外,如果您尝试使用Cookie进行身份验证,则服务器可能会因为您在第二次请求中传递auth=('username', 'password')
而感到困惑。这会生成授权标头,因此您既可以发送Cookie
标头,也可以发送Authorization
标头。服务器最有可能认为这是可疑的,并且正确地拒绝接受您的身份验证请求。