我正在尝试使用requests
模块从网站获取http响应。我在回复中获得了状态代码410:
<Response [410]>
从文档中可以看出,Web内容的转发URL可能无法由客户有意使用。确实如此,或者我错过了什么?试图确认网页是否可以废弃:
url='http://www.b2i.us/profiles/investor/ResLibraryView.asp?ResLibraryID=81517&GoTopage=3&Category=1836&BzID=1690&G=666'
try:
response = requests.get(url)
except requests.exceptions.RequestException as e:
print(e)
答案 0 :(得分:2)
某些网站对使用'python-requests'作为用户代理字符串的HTTP请求反应不佳 如果将User-Agent标头设置为“Mozilla”,则可以获得200 OK响应。
url='http://www.b2i.us/profiles/investor/ResLibraryView.asp?ResLibraryID=81517&GoTopage=3&Category=1836&BzID=1690&G=666'
headers={'User-Agent':'Mozilla/5'}
response = requests.get(url, headers=headers)
print(response)
&LT;回复[200]&gt;
答案 1 :(得分:0)
这适用于Mac OSX,但我在VMWare虚拟机上遇到与Windows相同的方法问题我运行自动化任务。为什么行为会有所不同? Window机器是否有单独的解决方法?