从mongodb删除许多文件

时间:2012-04-27 06:11:18

标签: php mongodb mongodb-php

我从事多租户网络应用程序。有必要清除一些用户容器,这些容器可能相当大,收集了许多文档。 我需要能够删除许多类似的文档:

    return self::remove(array('LISTID' => $listId), array('safe' => true));

在某些情况下,可能有许多文档符合此标准,例如数千甚至数百万。我担心这个操作可能需要很长时间并节省服务器。 如果有很多文档,是否值得将这样的操作排队等离线删除它们像伪代码:

while (there are documents) {
  delete(1000 documents);
  sleep();
}

我想知道在这种情况下如何通过mongodb中较小的portios删除数据。我还注意到由于某些原因在mongodb中删除相当多的行发生得相当快,我们有在mongodb中存储数据的原型,在mysql中删除相似数量的行需要更长的时间,但在mysql中,表中的每一行都引用了其他表有了数据,但即使没有依赖表中的记录,在mongodb中看起来要快得多,在mongodb中它将所有数据都存储在文档中,但无论如何我觉得相当奇怪。 或者它可能是多余的?

谢谢。

1 个答案:

答案 0 :(得分:6)

这是您在应用程序中必须执行的操作。在PHP中,你可以f.e.做类似的事情:

$found = false;
$ids = $collection->find(array('LISTID' => $listId), array('_id' => 1))->limit(1000);
do {
    $found = 0;
    $idsToDelete = array(); // we'll collect all the ids here, so that we can delete them in a batch
    foreach( $ids as $res )
    {
        $found++;
        $idsToDelete[] = $res['_id'];
    }
    $collection->remove(array('_id' => array( '$in' => $idsToDelete )));
    sleep(15);
} while ( $found );

你需要确定你有一个关于LISTID的索引,否则find(array('LISTID' => $listId)可能会让事情变得非常缓慢。