我试图这样做,
import requests
s=requests.Session()
login_data = dict(userName='user', password='pwd')
ra=s.post('http://example/checklogin.php', data=login_data)
print ra.content
print ra.headers
ans = dict(answer='5')
f=s.cookies
r=s.post('http://example/level1.php',data=ans,cookies=f)
print r.content
但是第二个帖子请求会返回404错误,有人可以帮我解释原因吗?
答案 0 :(得分:5)
在最新版本的requests
中,他的会话对象位于Cookie Persistence
,查看请求会话ojbects docs。
因此,您不需要人工添加cookie。
刚
import requests
s=requests.Session()
login_data = dict(userName='user', password='pwd')
ra=s.post('http://example/checklogin.php', data=login_data)
print ra.content
print ra.headers
ans = dict(answer='5')
r=s.post('http://example/level1.php',data=ans)
print r.content
只需打印cookie即可查找您记录的内容。
for cookie in s.cookies:
print (cookie.name, cookie.value)
示例网站是你的吗?
如果没有,也许网站拒绝机器人/爬虫!
您可以像使用浏览器一样更改请求的用户代理。
例如:
import requests
s=requests.Session()
headers = {
'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/29.0.1547.62 Safari/537.36'
}
login_data = dict(userName='user', password='pwd')
ra=s.post('http://example/checklogin.php', data=login_data, headers = headers)
print ra.content
print ra.headers
ans = dict(answer='5')
r=s.post('http://example/level1.php',data=ans, headers = headers)
print r.content
祝你好运〜