当浏览器正常运行时,Requests.get返回403

时间:2019-06-16 18:39:12

标签: python web-scraping python-requests http-status-code-403

当我从浏览器请求https://haveibeenpwned.com/unifiedsearch/jonathan@gmail.com时,一切正常,但是当我从Python请求时,它抛出403。

我在python请求中设置了用户代理,但我不断收到403响应。

我的代码:

import requests 

url="https://haveibeenpwned.com/unifiedsearch/jonathan@gmail.com"

headers={'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'}

r=requests.get(url,headers=headers)

print(r.status_code)  # 403

有人知道为什么要扔403吗?

非常感谢您。

1 个答案:

答案 0 :(得分:1)

尝试打印出r.text,其中包含响应的正文。我收到了403,尝试您的代码。文本表明它试图让您证明自己不是机器人(当然,这是....)