Mongodb索引如何运作?

时间:2012-11-03 09:28:12

标签: mongodb indexing

I have a collection such as:
{u'_id': ObjectId('5094cc44e3f0f827b3618918'),
  u'xxx': 0},
 {u'_id': ObjectId('5094cc44e3f0f827b3618919'),
  u'xxx': 1},
 {u'_id': ObjectId('5094cc44e3f0f827b361891a'),
  u'xxx': 2},
 {u'_id': ObjectId('5094cc44e3f0f827b361891b'),
  u'xxx': 3},
 {u'_id': ObjectId('5094cc44e3f0f827b361891c'),
  u'xxx': 4}
...

当我创建索引如:

db.test.ensure_index([("_id",-1),("xxx",1)])
db.test.ensure_index([("xxx",1)])

然后,我使用解释如:

db.test.find({"xxx":1}).sort("_id",-1).skip(5).limit(5).explain()

result is:
{u'allPlans': [{u'cursor': u'BtreeCursor _id_ reverse',
                u'indexBounds': {u'_id': [[{u'$maxElement': 1},
                                           {u'$minElement': 1}]]},
                u'n': 9,
                u'nscanned': 34,
               u'nscannedObjects': 34},
               {u'cursor': u'BtreeCursor xxx_1',
                u'indexBounds': {u'xxx': [[1, 1]]},
                u'n': 34,
                u'nscanned': 34,
                u'nscannedObjects': 34},
               {u'cursor': u'BtreeCursor _id_-1_xxx_1',
                u'indexBounds': {u'_id': [[{u'$maxElement': 1},
                                           {u'$minElement': 1}]],
                                 u'xxx': [[1, 1]]},
                u'n': 10,
                u'nscanned': 38,
                u'nscannedObjects': 10},
               {u'cursor': u'BasicCursor',
                u'indexBounds': {},
                u'n': 16,
                u'nscanned': 34,
                u'nscannedObjects': 34}],
 u'cursor': u'BtreeCursor xxx_1',
 u'indexBounds': {u'xxx': [[1, 1]]},
 u'indexOnly': False,
 u'isMultiKey': False,
 u'millis': 1,
 u'n': 5,
 u'nChunkSkips': 0,
 u'nYields': 0,
 u'nscanned': 34,
 u'nscannedAllPlans': 140,
 u'nscannedObjects': 34,
 u'nscannedObjectsAllPlans': 112,
 u'scanAndOrder': True,
 u'server': u'ubuntu:27017'}

来自n,nscanned和nscnnedObjects的num,我认为它应该使用u'BtreeCursor id -1_xxx_1'作为光标,但为什么它使用u'cursor':u'BtreeCursor xxx_1', ?     任何人都可以给我一些建议吗?我对索引优化有一点了解。

1 个答案:

答案 0 :(得分:3)

指数中的字段顺序很重要;查找和排序示例的最佳复合索引实际上是:

db.test.ensure_index([("xxx",1),("_id",-1)])

由于您的搜索条件位于字段“xxx”上,因此将此字段放在索引中的第一位将比_id搜索结果更多,然后过滤到符合xxx条件的文档。

如果查看n中查询优化器考虑的每个计划的allPlans数字,BtreeCursor xxx_1索引实际上返回的结果最多(34)。其他索引返回9,10和16个结果..因此对于给定的搜索条件效率会降低。

有关索引优化的更多信息,本文非常有用:Optimizing MongoDB Compound Indexes