在Python请求中清空RequestsCookieJar

时间:2018-05-30 08:25:57

标签: python cookies python-requests httprequest instagram

我正在使用Python请求模块。

>>> import requests
>>> s1 = requests.Session()
>>> r1 = s1.get("https://www.facebook.com/")
>>> r1.cookies
<RequestsCookieJar[Cookie(version=0, name='fr', ... ]>

即。 RequestsCookieJar已满,并且我尝试的每个网址都已满。但对于Instagram,我得到:

>>> s2 = requests.Session()
>>> r2 = s2.get("https://www.instagram.com/")
>>> r2.cookies
<RequestsCookieJar[]>

即。 RequestsCookieJar是空的,但它应该返回一些东西。

有人可以解释一下为什么会这样吗?

谢谢。

1 个答案:

答案 0 :(得分:0)

因为Instagram。当您首先打开Instagram时,它不会向您发送cookie,您必须登录,或再次提出请求。

更新:如您要登录,并想要csrf令牌,有方法:

import json
import requests
import lxml.html

def get_csrf_token(content):
    xpath_data = lxml.html.fromstring(content).xpath('/html/body/script[1]/text()')[0]
    raw_json = xpath_data[xpath_data.find('{'):-1]
    return json.loads(raw_json)["config"]["csrf_token"]

def get_main_page():
    session = requests.Session()
    content = session.get('https://instagram.com')

    csrf_token = get_csrf_token(content.content)
    header = {'x-csrftoken'      : csrf_token,
              'x-requested-with' : 'XMLHttpRequest',
              'User-Agent'       : "Your user agent there",
              "referer"          : 'https://instagram.com',
              "cookie"           : "ig_cb=1",
              "origin"           : 'https://instagram.com'}

    session.headers.update(header)

我认为你可以写&#34; POST&#34;通过登录的方法。