似乎总是略有偏离。
在使用CURL下载HTML文件时,我试图验证保存的HTML文件的大小与标题所示的大小相同。
缩小:
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $URL);
$result = curl_exec($ch);
$curlinfo = curl_getinfo($ch);
除其他事项外,$curlinfo
提供以下信息:
[size_download] => 331650
[download_content_length] => 331650
(根据我的经验,这些价值总是相同的)
我尝试使用mb_strlen
mb_strlen($result, 'utf8');
= 331495
mb_strlen($result);
= 331495
稍微关闭。
使用DOM保存该文件
$DOM = new DOMDocument();
$DOM->preserveWhiteSpace = FALSE;
libxml_use_internal_errors(true);
$DOM->LoadHTML($result);
$DOM->encoding = 'utf-8';
$SaveHTMLfile = $DOM->saveHTMLFile($filename);
使用filesize($fileName);
更多... FileSize:332295
当然,如果我修改编码,或修改preserveWhiteSpace
设置filesize($filename)
的值会偏斜一种。.永远不要对curl标头({{1} })。
有没有一种方法或方法可以让我验证从外部源下载到实际字节的HTML文件?