我目前正在开发一个上传一组文件的工具,然后使用md5校验和将文件与上传的最后一批文件进行比较,并告诉您哪些文件已更改。
对于常规文件,这工作正常,但是一些上传的文件是zip存档,几乎总是已经更改,即使其中的文件是相同的。
有没有办法执行不同类型的校验和来检查这些文件是否已更改,而无需单独解压缩每个文件,然后单独比较每个文件的内容。
这是我当前的功能
function check_if_changed($date, $folder, $filename)
{
$dh = opendir('./wp-content/uploads/Base/');
while (($file = readdir($dh)) !== false) {
$folders[] = $file;
}
sort($folders);
$position = array_search($date, $folders);
$prev_folder = $folders[$position - 1];
if ($prev_folder == '.' || $prev_folder == '..')
{ return true;}
$newhash = md5_file('./wp-content/uploads/Base/'.$date.'/'.$folder.'/'.$filename);
$oldhash = md5_file('./wp-content/uploads/Base/'.$prev_folder.'/'.$folder.'/'.$filename);
if ($oldhash != $newhash){
return true;
}
return false;
}
答案 0 :(得分:5)
在zip存档中,每个“文件”都存储有元数据,如最后修改时间,文件名,文件大小等字节等......以及重要部分 - crc32校验和。
基本上,您可以以二进制方式操作zip存档,查找每个文件的元数据头并将校验和与先前存储的校验和进行比较。您无需进行任何解压缩即可访问zip存档中的元数据。这将非常快。
http://en.wikipedia.org/wiki/Zip_(file_format)
编辑 - 实际上,ZipArchive提供此功能。看到: http://www.php.net/manual/en/ziparchive.statindex.php
答案 1 :(得分:0)
您只能提取ZIP文件的文件部分然后哈希,但是您也必须删除元信息!
因此,提取文件确实是最简单的解决方案。