我使用以下代码返回网址
import requests
answer = requests.get('http://www.website.com')
answer.status_code
>>>200
这让我回到了200。
但是,该网站应返回404。
answer.content
>>>b'<html><head>\r\n<title>404 Not Found</title>\r\n</head><body>\r\n<h1>Not Found</h1>\r\n<p>The requested URL index.php was not found on this server.</p>\r\n<hr>\r\n<address>Apache/2.2.22 (Linux) Server at Port <small onclick="document.getElementById(\'login\').style.display = \'block\';">80</small></address>\r\n</body></html><div id="login" style="display:none;"><pre align=center><form method=post>Password: <input type=password name=pass><input type=submit value=\'>>\'></form></pre></div>'
有人可以告诉我差异源于何处以及我如何解决这个问题以获得answer.status_code = 404而不是200?我无法直接访问服务器,但我可以询问管理员。
谢谢!
答案 0 :(得分:1)
重定向和历史记录 默认情况下,Requests将为除HEAD之外的所有动词执行位置重定向。
我们可以使用Response对象的history属性来跟踪重定向。
Response.history列表包含为完成请求而创建的Response对象。该列表从最旧的响应到最新的响应排序。
例如,GitHub将所有HTTP请求重定向到HTTPS:
>>> r = requests.get('http://github.com')
>>> r.url
'https://github.com/'
>>> r.status_code
200
>>> r.history
[<Response [301]>]
如果您正在使用GET,OPTIONS,POST,PUT,PATCH或DELETE,则可以使用allow_redirects参数禁用重定向处理:
>>> r = requests.get('http://github.com', allow_redirects=False)
>>> r.status_code
301
>>> r.history
[]
如果您正在使用HEAD,您也可以启用重定向:
>>> r = requests.head('http://github.com', allow_redirects=True)
>>> r.url
'https://github.com/'
>>> r.history
[<Response [301]>]