将发电机分成块的最佳方法

时间:2015-11-16 08:19:15

标签: php foreach generator chunks

你能帮我写一下这个代码,它将发生器产量分解为100块,并将它们保存到更美观的数据库中。

$batchSize = 100;

$batch = [];
$i = 0;

/** 
 * @yield array $item
 */
foreach(itemsGenerator() as $item) {
    $batch[] = $item;
    $i++;

    if ($i === $batchSize) {
        Db::table('items')->save($batch);

        $batch = [];
        $i = 0;
    }

    $cnt++;
}

if ($batch) {
     Db::table('items')->save($batch);
}

我不想在itemsGenerator

中打破分块的逻辑

1 个答案:

答案 0 :(得分:4)

您可以将块逻辑放入单独的可重用函数中。

解决方案1:每个块都是生成器。

deprecated People API page

function generator_chunks(\Generator $generator, $max_chunk_size) {
  $chunk = [];
  foreach ($generator as $item) {
    $chunk[] = $item;
    // @todo A local variable might be faster than count(), but adds clutter to the code. So using count() for this example code.
    if (count($chunk) >= $max_chunk_size) {
      yield $chunk;
      $chunk = [];
    }
  }
  if ([] !== $chunk) {
      // Remaining chunk with fewer items.
      yield $chunk;
  }
}

function generator() {
    for ($i = 0; $i < 11; ++$i) {
        yield $i;
    }
}

foreach (generator_chunks(generator(), 3) as $chunk) {
    print json_encode($chunk) . "\n";
}

解决方案2:每个块都是一个数组。

https://3v4l.org/3eSQm

ctid

现在所有的一个块都将作为一个数组同时存在于内存中,但不是整个序列。

可能有一些方法可以使每个块表现得像一个生成器。但这是另一天不同的故事。