是否可以使用现有登录会话(例如在Chrome中)并将该会话传递给python脚本以执行https请求?
要明确我想做什么,有一个网站的内容只有在您登录时才能访问,但是为简单的http auth卷曲凭证是不可行的,因为它实际上有验证码。所以我要做的是,登录说浏览器,并将该会话提取到python脚本,并通过该会话请求URL。我有道理吗?
import requests
url="http://stackoverflow.com/"
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/37.0.2062.120 Safari/537.36"}
cookie = {
"domain": ".stackoverflow.com",
"expirationDate": "1427212131.77312",
"hostOnly": "false",
"httpOnly": "true",
"name": "usr",
"path": "/",
"secure": "false",
"session": "false",
"storeId": "0",
"value": "SOMEVALUE",
"id": "5"
}
t = open("response.txt", "w")
t.write(requests.get(url, headers=headers, cookies=cookie).text.encode("ascii", "ignore"))
所以我尝试了这个,它似乎没有让我到任何地方。如果我查看响应,我发现它实际上是没有任何用户登录的页面。不知道我还缺少什么...
答案 0 :(得分:2)
如果您重复使用浏览器的Cookie和用户代理,则应该可以这样做。据我所知,任何此类解决方案都是特定于浏览器的:我遇到过a script使用SQLite提取Chrome Cookie并使用它们向Requests
库发出HTTP请求。 / p>
脚本的chrome_cookies
方法返回包含cookie的字典。如果您使用Requests
库,则可以在发出请求时将字典作为关键字参数传递:
import requests
import pyCookieCheat
url = 'http://www.example.com'
s = requests.Session()
cookies = pyCookieCheat.chrome_cookies(url)
s.get(url, cookies = cookies)
答案 1 :(得分:1)
为什么不解析生成的CAPTCHA,显示图像并手动输入解决方案?与实际劫持会话相比,它可能更容易解决您的问题。另外,它会产生更便携和稳定的脚本(可能)。
答案 2 :(得分:0)
这可能会有所帮助
jar = requests.cookies.RequestsCookieJar([
{
"domain": ".stackoverflow.com",
"expirationDate": "1427212131.77312",
"hostOnly": "false",
"httpOnly": "true",
"name": "usr",
"path": "/",
"secure": "false",
"session": "false",
"storeId": "0",
"value": "SOMEVALUE",
"id": "5"
}]
requests.get(url, headers=headers, cookies=jar)
@Stupid.Fat.Cat让我知道什么对你有用