在AWS EC2服务器中使用python3向此网站(https://volusia.county-taxes.com)发出get请求时,我收到403响应。但是我正在使用相同的代码在本地系统中获得成功响应。
请帮助我。为什么我无法在AWS EC2服务器中发出获取请求?
在AWS EC2服务器中
import requests
requests.get('https://volusia.county-taxes.com')
<Response [403]>
在我的本地系统中
import requests
requests.get('https://volusia.county-taxes.com')
<Response [200]>
答案 0 :(得分:0)
不能肯定地说,但是403是一个“禁止”代码,对于某些网站来说,阻止来自ec2 ip范围的流量以减少可能出现的僵尸程序/抓取程序的数量并不是很不寻常滥用网站,并且通常在AWS和其他云提供商上运行。
有可能整个ec2 ip范围被阻止,或者仅某些ip被阻止-尤其是如果您已经从该ip运行某种爬虫程序,则它可能会被列入黑名单。