如何在mongo集合中获取子文档数组的分页/切片数据?

时间:2013-08-10 01:28:59

标签: mongodb

我有一个这样的集合:

{
"_id" : ObjectId("51f4ad560364f5490ccebe26"),
"fiTpcs" : [
    "uuid1",
    "uuid2",
    "uuid3",
    "uuid4",
    "uuid5"
],
"fiTpcsCnt" : 5
}

fiTpcs列表很长,以后可以发展到数百个。当我检索我的收藏时,我希望得到一个有限的fiTpcs列表,一次说20个并发出单独的请求以从fiTpcs获取后续数据。我只想确保稍后当我有更多数据时查询不会变慢。有没有办法在mongodb中做到这一点?直到现在,我一直在做

db.userext.find({"_id" : ObjectId("51f4ad560364f5490ccebe26")}).pretty();

总是让我获得完整的fiTpcs数组。我在Spring中使用java驱动程序,使用Spring / java的解决方案也没问题。请注意 - 如果解决方案需要mongo扫描整个fiTpcs数组,然后切片一部分,它并没有真正增加任何性能优势,这不是我想要的。

2 个答案:

答案 0 :(得分:9)

我可能无法全面了解您的问题,但似乎$slice是您正在寻找的机器人:

> db.page.find()
{ "_id" : ObjectId("51f4ad560364f5490ccebe26"), "fiTpcs" : [ "uuid1", "uuid2", "uuid3", "uuid4", "uuid5" ], "fiTpcsCnt" : 2 }
> db.page.find({}, {"fiTpcs" : {$slice : 3}})
{ "_id" : ObjectId("51f4ad560364f5490ccebe26"), "fiTpcs" : [ "uuid1", "uuid2", "uuid3" ], "fiTpcsCnt" : 2 }
> db.page.find({}, {"fiTpcs" : {$slice : [1,3]}})
{ "_id" : ObjectId("51f4ad560364f5490ccebe26"), "fiTpcs" : [ "uuid2", "uuid3", "uuid4" ], "fiTpcsCnt" : 2 }

答案 1 :(得分:-1)

经过几天思考/尝试各种选择后,这就是我最终所做的。我修改了我的文档:

{
  "_id" : ObjectId("51f4ad560364f5490ccebe26"),
  "page" : 1,  //1 is the default
  "slug" : "some-unique-string-identifier"
  "fiTpcs" : [
    "uuid1",   //these could be long text, like a long comment/essay
    "uuid2",
    "uuid3",
    "uuid4",
    "uuid5"
  ],
  "fiTpcsCnt" : 5
}

我在memcached中保留了“pageCount”和“totalFiTpcsCnt”。我已设置MAX_FITPCSCNT = 500(现在为500,实验性)。当我创建一个userext类型的新文档时,我将页面值设置为1.

如果我必须将新对象推送到fiTpcs数组:

1)检查“totalFiTpcsCnt”是否为500的倍数。如果是,则创建一个类型为userext的新文档,其中包含相同的slug,fiTpcsCnt为0,fiTpcs数组为null。 2)更新最后的userext - 通过slug和“pageCount”查询,推送到fiTpcs。退出“pageCount”和“totalFiTpcsCnt”的缓存。

每当我需要我的userext文档时,我总是只看第一页。这样我就不需要一次查询超过500个类型为fiTpcs的对象,并且我仍然会在memcached中更新totalFiTpcsCnt。