我在节点js中使用mongoose驱动程序。我的架构:
let sendResultSchema = mongoose.Schema({
emailId: String, email: String,
letterId: String, sendedFrom: String,
resultMsg: String, owner: String,
created: Date, result: Boolean,
tag: String, tryNum: Number,
clickHash: String, links: [String]
})
sendResultSchema.index({emailId: 1, letterId: 1, result: 1, owner: 1, tag: 1, clickHash: 1})
let sendResultModel = mongoose.model('sendresult', sendResultSchema)
sendresult集合有641000个文档。
此查询执行~0.5秒。
db.sendresults.find({"tag" : "tagValue", "letterId" : "5ad630b5949bb02ea07d15d1"}).sort({emailId: -1}).limit(1)
我认为它必须执行得更快。您可以看到此查询的解释here
如何让这个查询更快?
答案 0 :(得分:6)
索引需要涵盖查询的所有部分(相等部分,排序部分和范围部分)。这是因为在典型的find()
查询中,MongoDB只使用一个索引。例如,它通常不使用一个索引用于相等部分,而另一个索引用于排序部分。
通常,索引中的字段序列需要遵循相等的模式 - >排序 - >范围强>
Optimizing MongoDB Compound Indexes中详细介绍了这一点。
对于您的查询,相等部分为tag:..., letterId:...
,排序部分为emailId:-1
。您的查询中没有范围部分。
使用此模式,您需要的复合索引是:
db.test.createIndex({tag:1, letterId:1, emailId:-1})
让我们尝试确定使用此索引可以获得多少性能提升。
为了确认索引的适用性,我使用mgeneratejs将100万条记录插入到测试数据库中,这是一个使用模板创建随机文档的工具。
根据您的示例,我使用的mgeneratejs
模板是:
$ cat template.json
{
"emailId": "$hash",
"email": "$email",
"letterId": "$hash",
"sendedFrom": "$email",
"resultMsg": "$word",
"owner": "$name",
"created": "$date",
"result": "$bool",
"tag": "$word",
"tryNum": {"$integer": {"min": 0, "max": 1e3}},
"clickHash": "$word",
"links": {"$array": {"of": "$url", "number": {"$integer": {"min": 1, "max": 5}}}}
}
并将100万个随机文档导入MongoDB:
$ mgeneratejs template.json -n 1000000 | mongoimport -d test -c test
然后我创建了你拥有的索引,并试图找到一个不存在的文档,并收集了10个查询,其中包含仅包含该索引的集合:
> db.test.createIndex({emailId: 1, letterId: 1, result: 1, owner: 1, tag: 1, clickHash: 1})
> db.test.find({"tag" : "xyz", "letterId" : "abc"}).sort({emailId: -1}).limit(1)
Fetched 0 record(s) in 3069ms
Fetched 0 record(s) in 2924ms
Fetched 0 record(s) in 2923ms
Fetched 0 record(s) in 3013ms
Fetched 0 record(s) in 2917ms
Fetched 0 record(s) in 2961ms
Fetched 0 record(s) in 2882ms
Fetched 0 record(s) in 2870ms
Fetched 0 record(s) in 2969ms
Fetched 0 record(s) in 2863ms
所以使用该索引,查询的响应时间不是很快,大多数执行时间接近3秒。
通过添加最佳相等 - >排序 - >范围指数:
> db.test.createIndex({tag:1, letterId:1, emailId:-1})
> db.test.find({"tag" : "xyz", "letterId" : "abc"}).sort({emailId: -1}).limit(1)
Fetched 0 record(s) in 2ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 1ms
Fetched 0 record(s) in 3ms
相反,使用最佳指数,性能得到显着改善。没有超过3毫秒的返回查询,绝大部分时间都会在1毫秒内返回。
答案 1 :(得分:0)
如果不需要记录中的所有字段,则可以通过仅返回必要的字段来加快查询速度。 喜欢;
db.sendresults.find({"tag" : "tagValue", "letterId" : "5ad630b5949bb02ea07d15d1"},{"_id":0,"tag":1,"email":1}).sort({emailId: -1}).limit(1)
exp。使字段等于1意味着返回该字段。我输入了“ _id:0”,因为我不想在mongodb中获取记录的ID。如果您不添加“ _id:0”进行查询,则会自动返回ID。
在处理具有更多嵌套字段的记录时,它为我节省了很多时间。