如何从scrapy响应中获取cookie并将cookie设置为下一个请求?

时间:2016-04-06 06:32:30

标签: python redirect cookies scrapy

我已禁用Default Scrapy cookie选项,因此我必须手动设置它。

COOKIES_ENABLED = False
COOKIES_DEBUG = True

现在,我需要使用作为同一站点的响应接收的值来设置cookie。我可以获得如下的cookie,

cookie = response.headers.getlist('Set-Cookie')[0].split(";")[0].split("=")

现在我正在尝试通过

将其设置为表单请求
FormRequest.from_response(response,
                formdata={"username": "asldkfs", "pass": "slskd"},
                cookies={cookie[0]:cookie[1]},
                meta = {'dont_redirect': True,'handle_httpstatus_list': [302]},
                callback=self.redirection)

def redirection(self,response): 
    self.log("redirection")
    self.log(response.headers)               
    self.log("Cookie2")
    cook1 = response.headers.getlist('Set-Cookie')[0].split(";")[0].split("=")
    self.log(cook1)        
    self.log("end cookie2")
    return Request("http://something.net/some/sa/"+response.headers.getlist('Location')[0],cookies={cook1[0]:cook1[1]},
        callback=self.check_login_response)

.
.
.

所以我无法设置cookie。我是否还需要设置任何其他值或可能是什么问题?

3 个答案:

答案 0 :(得分:9)

只有将COOKIES_ENABLED设置为True才能使用cookies参数,因为CookiesMiddleware会处理它。

因此,您必须在标题上手动设置它:

cookie = response.headers.getlist('Set-Cookie')[0].split(';')[0]

FormRequest.from_response(response,
            formdata={"username": "asldkfs", "pass": "slskd"},
            headers={'Cookie': cookie}, # <---
            meta = {'dont_redirect': True,'handle_httpstatus_list': [302]},
            callback=self.redirection)

答案 1 :(得分:1)

如果您禁用了Cookie,我认为您无法使用Cookie。

答案 2 :(得分:1)

answer from Paulo Romeira 是正确的,只是缺少从字节到字符串的解析:

cookie = response.headers.getlist('Set-Cookie')[0].decode("utf-8").split(";")[0].split("=")