我试图从需要登录的网站上搜集一些数据。更复杂的是,我正在从三个不同的账户中抓取数据。换句话说,我需要登录该站点,抓取数据然后注销三次。
我尝试过的(非常简化的)代码如下:
import requests
for account in [account1,account2,account3]:
with requests.session() as session:
[[login code here]]
[[scraping code here]]
session.get(url + "/logout")
使用第一个帐户的抓取工作正常,但在此之后它没有。我假设这是因为我没有正确退出。我该怎么做才能解决这个问题?
答案 0 :(得分:1)
这很简单:
您应该伪造正确的登录请求。
要执行此操作,请转到登录页面:
Content-Type
标题,它可能会破坏您的代码。)requests.[get|post](...)
替换为session.[get|post](...)