我正在尝试自动检测断开的链接,我惊讶地发现HTTP HEAD method并不总是可靠的。例如URL:http://www.youtube.com/mit - 可以使用GET方法访问URL,但尝试使用HEAD方法联系URL最终会收到404错误(未找到)。
注意:可以通过以下网址轻松在线查看该示例:http://web-sniffer.net/ (我不以任何方式加入网页)
那么HEAD方法到底有多可靠?
作为一个合理的解决方案,我看到只是不使用HEAD并且总是始终使用GET方法,但这是浪费带宽。
答案 0 :(得分:4)
HEAD
必须按the RFC中所述的方式工作;但是,它的实现始终受任何特定站点的开发人员的支配,并且不可能强制执行RFC合规性。您可以相当确信任何网站都可以合理地支持HEAD
,但正如您已经发现的那样,没有任何保证。