我正在使用Python请求模块。
>>> import requests
>>> s1 = requests.Session()
>>> r1 = s1.get("https://www.facebook.com/")
>>> r1.cookies
<RequestsCookieJar[Cookie(version=0, name='fr', ... ]>
即。 RequestsCookieJar
已满,并且我尝试的每个网址都已满。但对于Instagram,我得到:
>>> s2 = requests.Session()
>>> r2 = s2.get("https://www.instagram.com/")
>>> r2.cookies
<RequestsCookieJar[]>
即。 RequestsCookieJar
是空的,但它应该返回一些东西。
有人可以解释一下为什么会这样吗?
谢谢。
答案 0 :(得分:0)
因为Instagram。当您首先打开Instagram时,它不会向您发送cookie,您必须登录,或再次提出请求。
更新:如您要登录,并想要csrf令牌,有方法:
import json
import requests
import lxml.html
def get_csrf_token(content):
xpath_data = lxml.html.fromstring(content).xpath('/html/body/script[1]/text()')[0]
raw_json = xpath_data[xpath_data.find('{'):-1]
return json.loads(raw_json)["config"]["csrf_token"]
def get_main_page():
session = requests.Session()
content = session.get('https://instagram.com')
csrf_token = get_csrf_token(content.content)
header = {'x-csrftoken' : csrf_token,
'x-requested-with' : 'XMLHttpRequest',
'User-Agent' : "Your user agent there",
"referer" : 'https://instagram.com',
"cookie" : "ig_cb=1",
"origin" : 'https://instagram.com'}
session.headers.update(header)
我认为你可以写&#34; POST&#34;通过登录的方法。