MongoDB:将_id哈希到整数?

时间:2013-02-11 18:35:34

标签: mongodb hash

使用mongoDB中的大型集合,对文档样本而不是整个集合进行分析通常很有帮助。一种干净的方法是通过将它们映射到整数的散列函数来运行ObjectIds,然后使用$ mod来选择文档的子样本。

重点是以有效随机的方式绘制文档样本:对集合的选择与我们可能关心的任何其他内容都不相关。

这样做有好办法吗?如果查询速度很快,则奖励积分。

PS:我知道random attribute方法,但不喜欢它,因为它浪费了存储空间。

1 个答案:

答案 0 :(得分:0)

难道你不能在数组中获取集合中所有docs文档,对数组进行排序,然后在该数组中选择随机索引位置吗?