python-requests - 正在覆盖user-agent

时间:2015-01-15 16:23:43

标签: python python-requests

我有

    logindata = {
        'username': 'me',
        'password': 'blbla'
    }
    payload = {'from':'me', 'lang':'en', 'url':csv_url}
    headers = {
        'User-Agent': 'Mozilla/5.0'
    }
    api_url = 'http://dev.mypage.com/admin/app/import/'

    with requests.Session() as s:
        s.post(api_url, data=json.dumps(logindata), headers=headers)

        print s.headers

        # An authorised request.
        r = s.get(api_url, params=payload, headers=headers)

我被拒绝但是因为403被禁止了。我打印了标题,我得到了:

..'User-Agent': 'python-requests/2.2.1 CPython/2.7.5 Windows/7'..

为什么我的'User-Agent': 'Mozilla/5.0'会被覆盖?我在这里想念的是什么?

2 个答案:

答案 0 :(得分:8)

headers 不以这种方式保存在会话中。

您需要在每次发出请求时明确传递它们,或者设置s.headers一次:

with requests.Session() as s:
    s.headers = {'User-Agent': 'Mozilla/5.0'}

您可以通过检查response.request.headers来检查是否发送了正确的标头:

with requests.Session() as s:
    s.headers = {'User-Agent': 'Mozilla/5.0'}

    r = s.post(api_url, data=json.dumps(logindata))
    print(r.request.headers)

另请参阅Session class的实施方式 - 每次发出请求it merges the request.headers with headers时,您都设置了会话对象:

headers=merge_setting(request.headers, self.headers, dict_class=CaseInsensitiveDict),

答案 1 :(得分:4)

如果您希望会话使用所有请求的特定标头,则需要在会话中明确设置这些标头:

with requests.Session() as s:
    s.headers.update(headers)
    s.post(api_url, data=json.dumps(logindata))

    # An authorised request.
    r = s.get(api_url, params=payload)

s.headers.update(headers)行将您的词典添加到会话标题中。

会话永远不会将来自请求的信息复制到其他请求的重用中。只捕获来自响应(特别是cookie)的信息以供重用。

有关详细信息,请参阅requests Session Objects documentation

  

会话还可用于向请求方法提供默认数据。这是通过向Session对象上的属性提供数据来完成的。