Question

我在节点js中使用mongoose驱动程序。我的架构：

let sendResultSchema = mongoose.Schema({
  emailId: String,      email: String,              
  letterId: String,     sendedFrom: String,
  resultMsg: String,    owner: String,              
  created: Date,        result: Boolean,
  tag: String,          tryNum: Number,
  clickHash: String,    links: [String]
})
sendResultSchema.index({emailId: 1, letterId: 1, result: 1, owner: 1, tag: 1, clickHash: 1})
let sendResultModel = mongoose.model('sendresult', sendResultSchema)

sendresult集合有641000个文档。

此查询执行~0.5秒。

 db.sendresults.find({"tag" : "tagValue", "letterId" : "5ad630b5949bb02ea07d15d1"}).sort({emailId: -1}).limit(1)

我认为它必须执行得更快。您可以看到此查询的解释here

如何让这个查询更快？

Answer 1

索引需要涵盖查询的所有部分（相等部分，排序部分和范围部分）。这是因为在典型的find()查询中，MongoDB只使用一个索引。例如，它通常不使用一个索引用于相等部分，而另一个索引用于排序部分。

通常，索引中的字段序列需要遵循相等的模式 - ＆gt;排序 - ＆gt;范围

Optimizing MongoDB Compound Indexes中详细介绍了这一点。

对于您的查询，相等部分为tag:..., letterId:...，排序部分为emailId:-1。您的查询中没有范围部分。

使用此模式，您需要的复合索引是：

db.test.createIndex({tag:1, letterId:1, emailId:-1})

让我们尝试确定使用此索引可以获得多少性能提升。

测试数据

为了确认索引的适用性，我使用mgeneratejs将100万条记录插入到测试数据库中，这是一个使用模板创建随机文档的工具。

根据您的示例，我使用的mgeneratejs模板是：

$ cat template.json { "emailId": "$hash", "email": "$email", "letterId": "$hash", "sendedFrom": "$email", "resultMsg": "$word", "owner": "$name", "created": "$date", "result": "$bool", "tag": "$word", "tryNum": {"$integer": {"min": 0, "max": 1e3}}, "clickHash": "$word", "links": {"$array": {"of": "$url", "number": {"$integer": {"min": 1, "max": 5}}}} }

并将100万个随机文档导入MongoDB：

$ mgeneratejs template.json -n 1000000 | mongoimport -d test -c test

测试1：非最佳指数

然后我创建了你拥有的索引，并试图找到一个不存在的文档，并收集了10个查询，其中包含仅包含该索引的集合：

> db.test.createIndex({emailId: 1, letterId: 1, result: 1, owner: 1, tag: 1, clickHash: 1}) > db.test.find({"tag" : "xyz", "letterId" : "abc"}).sort({emailId: -1}).limit(1) Fetched 0 record(s) in 3069ms Fetched 0 record(s) in 2924ms Fetched 0 record(s) in 2923ms Fetched 0 record(s) in 3013ms Fetched 0 record(s) in 2917ms Fetched 0 record(s) in 2961ms Fetched 0 record(s) in 2882ms Fetched 0 record(s) in 2870ms Fetched 0 record(s) in 2969ms Fetched 0 record(s) in 2863ms

所以使用该索引，查询的响应时间不是很快，大多数执行时间接近3秒。

测试2：相等 - ＆gt;排序 - ＆gt;范围索引

通过添加最佳相等 - ＆gt;排序 - ＆gt;范围指数：

> db.test.createIndex({tag:1, letterId:1, emailId:-1}) > db.test.find({"tag" : "xyz", "letterId" : "abc"}).sort({emailId: -1}).limit(1) Fetched 0 record(s) in 2ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 1ms Fetched 0 record(s) in 3ms

相反，使用最佳指数，性能得到显着改善。没有超过3毫秒的返回查询，绝大部分时间都会在1毫秒内返回。

Answer 2

如果不需要记录中的所有字段，则可以通过仅返回必要的字段来加快查询速度。喜欢；

db.sendresults.find({"tag" : "tagValue", "letterId" : "5ad630b5949bb02ea07d15d1"},{"_id":0,"tag":1,"email":1}).sort({emailId: -1}).limit(1)

exp。使字段等于1意味着返回该字段。我输入了“ _id：0”，因为我不想在mongodb中获取记录的ID。如果您不添加“ _id：0”进行查询，则会自动返回ID。

在处理具有更多嵌套字段的记录时，它为我节省了很多时间。

Mongo查询需要很长时间。如何让它更快？

2 个答案:

测试数据

测试1：非最佳指数

测试2：相等 - ＆gt;排序 - ＆gt;范围索引