我有一个存储html文件的缓存文件夹。它们会在需要时被覆盖,但很多时候,很少使用的页面也被缓存在那里,最终会占用空间(5周后,驱动器已经满了超过270万个缓存文件)。
什么是循环通过包含数十万个文件的目录的最佳方法,并删除超过1天的文件?
答案 0 :(得分:44)
我认为您可以通过使用readdir循环遍历目录并根据时间戳删除:
<?php
$path = '/path/to/files/';
if ($handle = opendir($path)) {
while (false !== ($file = readdir($handle))) {
$filelastmodified = filemtime($path . $file);
//24 hours in a day * 3600 seconds per hour
if((time() - $filelastmodified) > 24*3600)
{
unlink($path . $file);
}
}
closedir($handle);
}
?>
if((time() - $filelastmodified) > 24*3600)
将选择超过24小时的文件(24小时,每小时3600秒)。如果您想要几天,那么对于超过一周的文件,它应该为7 * 24 * 3600读取。
另请注意,filemtime
会返回上次修改文件的时间,而不是创建日期。
答案 1 :(得分:10)
应该是
if((time()-$filelastmodified) > 24*3600 && is_file($file))
以避免.
和..
目录出错。
答案 2 :(得分:5)
以下功能根据创建日期列出文件:
private function listdir_by_date( $dir ){
$h = opendir( $dir );
$_list = array();
while( $file = readdir( $h ) ){
if( $file != '.' and $file != '..' ){
$ctime = filectime( $dir . $file );
$_list[ $file ] = $ctime;
}
}
closedir( $h );
krsort( $_list );
return $_list;
}
示例:强>
$_list = listdir_by_date($dir);
现在,您可以遍历列表以查看其日期并相应地删除:
$now = time();
$days = 1;
foreach( $_list as $file => $exp ){
if( $exp < $now-60*60*24*$days ){
unlink( $dir . $file );
}
}
答案 3 :(得分:3)
// setup timezone and get timestamp for yesterday
date_default_timezone_set('Europe/Berlin'); // change to yours
$yesterday = strtotime('-1 day', time());
// setup path to cache dir and initialize iterator
$path = realpath('/path/to/files'); // change to yours
$objects = new RecursiveIteratorIterator(
new RecursiveDirectoryIterator($path));
// iterate over files in directory and delete them
foreach($objects as $name => $object){
if ($object->isFile() && ($object->getCTime() < $yesterday)) {
// unlink($object);
echo PHP_EOL, 'deleted ' . $object;
}
}
答案 4 :(得分:1)
/* Detele Cache Files Here */
$dir = "cache/"; /** define the directory **/
/*** cycle through all files in the directory ***/
foreach (glob($dir."*") as $file) {
//foreach (glob($dir.'*.*') as $file){
/*** if file is 24 hours (86400 seconds) old then delete it ***/
if (filemtime($file) < time() - 3600) { // 1 hour
unlink($file);
}
}
我正在使用它,希望它有所帮助。
答案 5 :(得分:0)
只是要注意戈登的时间比较(见上文:https://stackoverflow.com/a/2205833/1875965)是唯一正确的比较'天'而不是'24小时',因为并非所有日子都有24小时(夏季/冬季等) 。
E.g。使用
// setup timezone and get timestamp for yesterday
date_default_timezone_set('Europe/Berlin'); // change as appropriate
$yesterday = strtotime('-1 day', time());
比较文件日期。
这可能不是一个大问题,但是当您使用数周/数月等时可能会导致意外行为。我发现最好坚持使用上述方法,因为它会使任何涉及日期/时间的过程一致并避免混淆。
还要检查文件日期的时区,因为有时PHP的默认值与系统时区不同。
亲切的问候,桑德拉。
答案 6 :(得分:0)
$directory = $_SERVER['DOCUMENT_ROOT'].'/pathfromRoot/';
$files = array_slice(scandir($directory), 2);
foreach($files as $file)
{
// $extension = substr($file, -3, 3);
// if ($extension == 'jpg') // in case you only want specific files deleted
// {
$stat = stat($directory.$file);
$filedate = date_create(date("Y-m-d", $stat['ctime']));
$today = date_create(date("Y-m-d"));
$days = date_diff($filedate, $today, true);
// dd($days);
if ($days->days > 180)
{
unlink($directory.$file);
}
// }
}
答案 7 :(得分:-1)
通过更改@ pawel的解决方案我在下面创建了函数。 起初我忘了在文件名中添加“路径”,这需要半小时才能找到。
public function deleteOldFiles ($hours=24) {
$path='cache'.DS;
if ( $handle = opendir( $path ) ) {
while (false !== ($file = readdir($handle))) {
$filelastmodified = filemtime($path.$file);
if((time()-$filelastmodified) > 24*3600 && is_file($path.$file))
{
unlink($path.$file);
}
}
closedir($handle);
}
}