具有偏移量的递归目录迭代器

时间:2014-12-18 13:21:13

标签: php file-io recursion

是否可以从某一点开始循环?

$iterator = new \RecursiveIteratorIterator(new \RecursiveDirectoryIterator($path, $flags));

$startTime = microtime(true); 
foreach($iterator as $pathName => $file){

  // file processing here

  // after 5 seconds stop and continue in the next request
  $elapsedSecs = (microtime(true) - $startTime);
  if($elapsedSecs > 5)
     break;
}

但是如何在下一个请求中从断点恢复?

1 个答案:

答案 0 :(得分:2)

a)将时间计算从foreach中拉出来。你有一个开始时间,你想要一个5秒的运行时间,所以你可以预先计算结束时间(startime + 5s)。在foreach中,只需比较时间是否大于或等于endtime,然后中断。

b)问:是否可以从某一点开始循环?如何在下一个请求中从断点恢复?

我想到了两种方法。

您可以存储最后一个处理点和迭代器,并在最后一点+ 1处继续。 您可以通过调用iterator-> next()来保存迭代的最后位置并在下一个请求中快进到该位置,直到您到达要处理的下一个项目,即$ lastPosition + 1。 我们必须存储迭代器和lastPosition并在下一个请求中选择它们,直到 lastPosition等于迭代器中元素的总数。

或者,您可以在第一次运行时将迭代器转换为数组:$array = iterator_to_array($iterator);然后使用reduce数组方法。 (也许其他人知道如何减少迭代器对象。) 使用这种方法,您只能存储数据,这会将请求按请求减少到0。

代码未经测试。这只是一个快速的草案。

$starttime = time();
$endtime = $starttime + (5 * 60); // 5sec
$totalElements = count($array);

for($i = 0; $i <= $totalElements; $i++) 
{
    if(time() >= $endtime) {
        break;
    }

    doStuffWith($array[$i]);
}

echo 'Processed ' . $i . ' elements in 5 seconds';

// exit condition is "totalElements to process = 0"
// greater 1 means there is more work to do
if( ($totalElements - $i) >= 1) {

    // chop off all the processed items from the inital array
    // and build the array for the next processing request
    $reduced_array = array_slice(array, $i);

    // save the reduced array to cache, session, disk    
    store($reduced_array);
} else {
    echo 'Done.';
}

// on the next request, load the array and resume the steps above...

总而言之,这是批处理,可以通过worker / job-queue更有效地完成,例如: