我试图创建一个检查开放类的机器人,网页使用访问该网站时设置的cookie。但是我似乎无法使用我的代码的请求/会话来复制这个。
它应该做什么:
问题:
以下是我尝试的一些示例代码:
s = requests.Session()
# create the cookie using first link
r = s.get(url)
# r2 should be search results
r2 = s.post(urlWithSearchTerms, cookies=r.cookies)
# parse html etc, however loads wrong page
data = r2.text
soup = BeautifulSoup(data,"html.parser")
print(soup.prettify())
它不会加载搜索结果,而是加载第一页。
我也试过包含r.headers,使用sessions.post(url),不使用会话等。
如何让python加载第二页?
谢谢!
答案 0 :(得分:0)
您正在发送HTTP POST请求,您应该发送GET。
更改此行:
r2 = s.post(urlWithSearchTerms, cookies=r.cookies)
为:
r2 = s.get(urlWithSearchTerms, cookies=r.cookies)