我有一个db,让我们称之为“a”,在db中我有一个集合(“col”)。 我需要获取1k文档的样本并将它们存储在不同的数据库中(“b”在集合中(“col2”)。
整个操作必须在mongoDB服务器上运行,因为当它将结果返回给客户端时,需要花费很多时间(大文档)。
我考虑过eval,但它已被弃用。 我知道如何使用mongo查询,但不能使用pymongo:
db.getCollection('col').aggregate([{'$sample': {'size': 1000}}], allowDiskUse=true).forEach(function(doc){
db.getSiblingDB('b').getCollection('col2').insert(doc)
})
有人可以帮我吗?