我在一个集合上有一个聚合,有大约1.6M的寄存器。该咨询是其他更复杂的简单示例,但说明了我认为使用的索引的优化程度不佳。
db.getCollection('cbAlters').runCommand("aggregate", {pipeline: [
{
$match: { cre_carteraId: "31" }
},
{
$group: { _id: { ca_tramomora: "$cre_tramoMora" },
count: { $sum: 1 } }
}
]})
该查询约5秒钟。该colleccion有25个索引配置为不同的咨询。根据查询说明使用的是:
{
"v" : 1,
"key" : {
"cre_carteraId" : 1,
"cre_periodo" : 1,
"cre_tramoMora" : 1,
"cre_inactivo" : 1
},
"name" : "cartPerTramInact",
"ns" : "basedatos.cbAlters"
},
我创建了一个根据此特定查询调整的索引:
{
"v" : 1,
"key" : {
"cre_carteraId" : 1,
"cre_tramoMora" : 1
},
"name" : "cartPerTramTest",
"ns" : "basedatos.cbAlters"
}
查询优化器拒绝此索引,并建议我使用初始索引。我的查询解释的输出看起来像这样:
{
"waitedMS" : NumberLong(0),
"stages" : [
{
"$cursor" : {
"query" : {
"cre_carteraId" : "31"
},
"fields" : {
"cre_tramoMora" : 1,
"_id" : 0
},
"queryPlanner" : {
"plannerVersion" : 1,
"namespace" : "basedatos.cbAlters",
"indexFilterSet" : false,
"parsedQuery" : {
"cre_carteraId" : {
"$eq" : "31"
}
},
"winningPlan" : {
"stage" : "PROJECTION",
"transformBy" : {
"cre_tramoMora" : 1,
"_id" : 0
},
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"cre_carteraId" : 1,
"cre_periodo" : 1,
"cre_tramoMora" : 1,
"cre_inactivo" : 1
},
"indexName" : "cartPerTramInact",
"isMultiKey" : false,
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 1,
"direction" : "forward",
"indexBounds" : {
"cre_carteraId" : [
"[\"31\", \"31\"]"
],
"cre_periodo" : [
"[MinKey, MaxKey]"
],
"cre_tramoMora" : [
"[MinKey, MaxKey]"
],
"cre_inactivo" : [
"[MinKey, MaxKey]"
]
}
}
},
"rejectedPlans" : [
{
"stage" : "PROJECTION",
"transformBy" : {
"cre_tramoMora" : 1,
"_id" : 0
},
"inputStage" : {
"stage" : "IXSCAN",
"keyPattern" : {
"cre_carteraId" : 1,
"cre_tramoMora" : 1
},
"indexName" : "cartPerTramTest",
"isMultiKey" : false,
"isUnique" : false,
"isSparse" : false,
"isPartial" : false,
"indexVersion" : 1,
"direction" : "forward",
"indexBounds" : {
"cre_carteraId" : [
"[\"31\", \"31\"]"
],
"cre_tramoMora" : [
"[MinKey, MaxKey]"
]
}
}
}
]
}
}
},
{
"$group" : {
"_id" : {
"ca_tramomora" : "$cre_tramoMora"
},
"count" : {
"$sum" : {
"$const" : 1.0
}
}
}
}
],
"ok" : 1.0
}
然后,为什么优化器更喜欢一个较少调整的指数?对于此聚合,indexFilterSet(对于索引过滤的结果)是否为真?
如何改进此索引,或查询出错?
我对mongoDB没有太多经验,感谢您的帮助
答案 0 :(得分:0)
只要你有索引cartPerTramInact,优化器就不会使用你的cartPerTramTest索引,因为第一个字段是相同的并且顺序相同。
这也适用于其他索引。当索引具有相同顺序的相同键(如a.b.c.d,a.b.d,a.b)并且查询使用字段a.b时,它将支持a.b.c.d.无论如何你不需要那个索引a.b,因为你已经有两个索引,包括a.b(a.b.c.d和a.b.d) 索引a.b.d仅在使用a.b.d这些字段进行查询时使用,但是如果a.b已经非常有选择性,那么仅使用a.b部分对索引a.b.c.d进行选择可能会更快,并且执行“全表扫描”以查找d