python请求处理某些http响应

时间:2017-10-16 15:37:04

标签: python python-requests

我正在尝试使用requests模块从网站获取http响应。我在回复中获得了状态代码410:

<Response [410]>

从文档中可以看出,Web内容的转发URL可能无法由客户有意使用。确实如此,或者我错过了什么?试图确认网页是否可以废弃:

url='http://www.b2i.us/profiles/investor/ResLibraryView.asp?ResLibraryID=81517&GoTopage=3&Category=1836&BzID=1690&G=666'

try:
    response = requests.get(url)
 except requests.exceptions.RequestException as e:
    print(e)

2 个答案:

答案 0 :(得分:2)

某些网站对使用'python-requests'作为用户代理字符串的HTTP请求反应不佳 如果将User-Agent标头设置为“Mozilla”,则可以获得200 OK响应。

url='http://www.b2i.us/profiles/investor/ResLibraryView.asp?ResLibraryID=81517&GoTopage=3&Category=1836&BzID=1690&G=666'
headers={'User-Agent':'Mozilla/5'}
response = requests.get(url, headers=headers)
print(response)
  

&LT;回复[200]&gt;

答案 1 :(得分:0)

这适用于Mac OSX,但我在VMWare虚拟机上遇到与Windows相同的方法问题我运行自动化任务。为什么行为会有所不同? Window机器是否有单独的解决方法?