根据CURL验证保存的HTML文件大小size_download / download_content_length?

时间:2019-02-02 21:13:39

标签: php curl filesize

似乎总是略有偏离。

在使用CURL下载HTML文件时,我试图验证保存的HTML文件的大小与标题所示的大小相同。

缩小:

    $ch = curl_init();
    curl_setopt($ch, CURLOPT_URL, $URL);
    $result = curl_exec($ch);
    $curlinfo = curl_getinfo($ch);

除其他事项外,$curlinfo提供以下信息:

[size_download] => 331650
[download_content_length] => 331650

(根据我的经验,这些价值总是相同的)

我尝试使用mb_strlen

mb_strlen($result, 'utf8'); = 331495

mb_strlen($result); = 331495

稍微关闭。

使用DOM保存该文件

    $DOM = new DOMDocument();
    $DOM->preserveWhiteSpace = FALSE;
    libxml_use_internal_errors(true);
    $DOM->LoadHTML($result);
    $DOM->encoding = 'utf-8';
    $SaveHTMLfile = $DOM->saveHTMLFile($filename);

使用filesize($fileName);

进行检查

更多... FileSize:332295

当然,如果我修改编码,或修改preserveWhiteSpace设置filesize($filename)的值会偏斜一种。.永远不要对curl标头({{1} })。

有没有一种方法或方法可以让我验证从外部源下载到实际字节的HTML文件?

0 个答案:

没有答案