如何阅读发送假404标题的网页

时间:2013-02-13 15:12:18

标签: php header http-status-code-404 web-crawler

爬虫可以通过哪种方式从发送假404标头的页面中读取html。我尝试使用implodecurlfile_get_contents获取页面仍然会收到标题404错误。similar SO reference link

1 个答案:

答案 0 :(得分:1)

您可能希望使用curl(或Guzzle)并实际添加用户代理以及请求。如果没有给出(或阻止)用户代理,某些站点将返回404(或其他错误)