使用mongoDB中的大型集合,对文档样本而不是整个集合进行分析通常很有帮助。一种干净的方法是通过将它们映射到整数的散列函数来运行ObjectIds,然后使用$ mod来选择文档的子样本。
重点是以有效随机的方式绘制文档样本:对集合的选择与我们可能关心的任何其他内容都不相关。
这样做有好办法吗?如果查询速度很快,则奖励积分。
PS:我知道random attribute方法,但不喜欢它,因为它浪费了存储空间。
答案 0 :(得分:0)
难道你不能在数组中获取集合中所有docs文档,对数组进行排序,然后在该数组中选择随机索引位置吗?