我正在使用Python的Requests库来进行网页抓取。我正在使用Session()
对象在整个HTTP GET和POST请求链中保留会话。
我需要发出这样的HTTP POST请求:
POST http://www.examplesite.com/login HTTP/1.1
Host: www.examplesite.com
Proxy-Connection: keep-alive
Content-Length: 126
Cache-Control: max-age=0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
Origin: http://www.examplesite.com
User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_8_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.137 Safari/537.36
Content-Type: application/x-www-form-urlencoded
Referer: http://www.examplesite.com/anon
Accept-Encoding: sdch
Accept-Language: en-US,en;q=0.8
Cookie: SESS01be97003f5147af7927b0548df40bcd=qud5ra51jmtf9opnihn6tct2v0; has_js=1
我需要在请求会话中将参数has_js=1
添加到cookie对象。我无法找到有关此特定要求的任何信息。非常感谢帮助!
答案 0 :(得分:1)
has_js=1
只是另一个Cookie名称 - 值对(很可能是Drupal JavaScript probe cookie)。
您的浏览器发送的所有Cookie都会在一个Cookie
标题中连接起来,以;
分号分隔。 Cookie参数是Set-Cookie
标头的一部分,用于影响浏览器在存储值时所执行的操作,并且永远不会将Cookie
标头的一部分发送回服务器。
您只需将其添加到会话中即可:
session.cookies['has_js'] = '1'