为404错误发送文本URL的最有效方法是什么

时间:2014-12-08 16:41:19

标签: php url http-status-code-404 get-headers server-response

我有兴趣了解测试服务器响应代码(如404)的URL的最佳/最精简方法。 我目前正在使用与get_headers的php手册的评论中非常相似的内容:

<?php
function get_http_response_code($theURL) {
    $headers = get_headers($theURL);
    return substr($headers[0], 9, 3);
}

if(intval(get_http_response_code('filename.jpg')) < 400){
// File exists, huzzah!
}
?>

但是,在foreach例程中使用此缩放超过50个URL通常会导致我的服务器放弃并报告500响应(借助于确切错误的模糊性)。所以,我想知道是否存在资源较少的方法,并且可以检查质量上的URL响应代码?

1 个答案:

答案 0 :(得分:0)

您可以使用curl_multi_*函数同时执行多个curl请求。

但是,这仍将阻止执行,直到返回最慢的请求(以及响应解析的一些额外时间)。

这样的任务应该在后台使用cronjobs或simliar替代方案执行。

另外,在github和co。上有多个库,它们包含curl扩展以提供更好的api。

这个概念解决了这个问题:( cpu "fix" by Ren@php-docs

function getStatusCodes(array $urls, $useHead = true) {
    $handles = [];
    foreach($urls as $url) {
        $options = [
            CURLOPT_URL => $url,
            CURLOPT_RETURNTRANSFER => true,
            CURLOPT_NOBODY => $useHead,
            CURLOPT_FOLLOWLOCATION => true,
            CURLOPT_HEADER => 0
        ];
        $handles[$url] = curl_init();
        curl_setopt_array($handles[$url], $options);
    }

    $mh = curl_multi_init();

    foreach($handles as $handle) {
        curl_multi_add_handle($mh, $handle);
    }

    $running = null;
    do {
        curl_multi_exec($mh, $running);
        curl_multi_select($mh);
    } while ($running > 0);

    $return = [];
    foreach($handles as $handle) {
        $return[$eUrl = curl_getinfo($handle, CURLINFO_EFFECTIVE_URL)] = [
            'url' => $eUrl,
            'status' => curl_getinfo($handle, CURLINFO_HTTP_CODE) 
        ];
        curl_multi_remove_handle($mh, $handle);
        curl_close($handle);
    }
    curl_multi_close($mh);

    return $return; 
}

var_dump(getStatusCodes(['http://google.de', 'http://stackoverflow.com', 'http://google.de/noone/here']));