MongoDB提取文档速度慢(使用索引)

时间:2016-10-28 14:08:29

标签: mongodb performance amazon-web-services amazon-ec2

FETCH阶段是我的查询中的限制因素。我一直在研究,似乎mongodb读取的内容远远超过它的需要,并且没有充分利用带宽。

我的mongoDB-mongod实例似乎在单个查询上阅读很多内容。 使用1个EBS io 5000Piops附加(100GB)SSD在AWS EC2 m4.xlarge上进行测试。 16 GB内存。

  • 该机器仅包含用于测试目的的mongodb实例。
  • 数据库总共约为60GB(在磁盘上)(多个集合)。
  • 主要集合用于以下方案和查询。

db stats

db.stats()
{
    "db" : "database",
    "collections" : 4,
    "objects" : 406496932,
    "avgObjSize" : 326.3196544642064,
    "dataSize" : 132647938391,
    "storageSize" : 55475830784,
    "numExtents" : 0,
    "indexes" : 5,
    "indexSize" : 8940408832,
    "ok" : 1
 }

收集摘要:

db.collection.stats()  ->  
{    "ns" : "database.[collection###]",
    "count" : 367614513,
    "size" : 121155225858,
    "avgObjSize" : 329,
    "storageSize" : 52052197376,
    "capped" : false,
    "wiredTiger" : {"Left empty"},
    "nindexes" : 2,
    "totalIndexSize" : 8131604480,
    "indexSizes" : {
            "_id_" : 4373012480,
            "id_1_ts_-1" : 3758592000
    },
    "ok" : 1

查询:

db.[#######].find({ id : "######", 
   ts : { 
    "$gte" :
       ISODate("2016-10-01T00:00:00.000Z"), 
     $lt :
       ISODate("2016-10-07T02:00:00.000Z")
}}, {_id : 0,"u1"
     :1,"u2":1,"u3":1,"eq1" :1 ,"eq2" : 1,"eq3": 1,"ts" :1});

解释结果:

{
    "queryPlanner" : {
            "plannerVersion" : 1,
            "namespace" : "database.[collection]",
            "d" : false,
            "parsedQuery" : {
                    "$and" : [
                            {
                                    "id" : {
                                            "$eq" : "#####ID#####"
                                    }
                            },
                            {
                                    "ts" : {
                                            "$lt" : ISODate("2016-09-30T22:00:00Z")
                                    }
                            },
                            {
                                    "ts" : {
                                            "$gte" : ISODate("2016-09-22T22:00:00Z")
                                    }
                            }
                    ]
            },
            "winningPlan" : {
                    "stage" : "PROJECTION",
                    "transformBy" : {
                            "_id" : 0,
                            "u1" : 1,
                            "u2" : 1,
                            "u3" : 1,
                            "eq1" : 1,
                            "eq2" : 1,
                            "eq3" : 1,
                            "ts" : 1
                    },
                    "inputStage" : {
                            "stage" : "FETCH",
                            "inputStage" : {
                                    "stage" : "IXSCAN",
                                    "keyPattern" : {
                                            "id" : 1,
                                            "ts" : -1
                                    },
                                    "indexName" : "id_1_ts_-1",
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : false,
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "id" : [
                                                    "[\"#####ID#####\", \"#####ID#####\"]"
                                            ],
                                            "ts" : [
                                                    "(new Date(1475272800000), new Date(1474581600000)]"
                                            ]
                                    }
                            }
                    }
            },
            "rejectedPlans" : [ ]
    },
    "executionStats" : {
            "executionSuccess" : true,
            "nReturned" : 676745,
            "executionTimeMillis" : 170508,
            "totalKeysExamined" : 676745,
            "totalDocsExamined" : 676745,
            "executionStages" : {
                    "stage" : "PROJECTION",
                    "nReturned" : 676745,
                    "executionTimeMillisEstimate" : 167820,
                    "works" : 676746,
                    "advanced" : 676745,
                    "needTime" : 0,
                    "needYield" : 0,
                    "saveState" : 8970,
                    "restoreState" : 8970,
                    "isEOF" : 1,
                    "invalidates" : 0,
                    "transformBy" : {
                            "_id" : 0,
                            "u1" : 1,
                            "u2" : 1,
                            "u3" : 1,
                            "eq1" : 1,
                            "eq2" : 1,
                            "eq3" : 1,
                            "ts" : 1
                    },
                    "inputStage" : {
                            "stage" : "FETCH",
                            "nReturned" : 676745,
                            "executionTimeMillisEstimate" : 166470,
                            "works" : 676746,
                            "advanced" : 676745,
                            "needTime" : 0,
                            "needYield" : 0,
                            "saveState" : 8970,
                            "restoreState" : 8970,
                            "isEOF" : 1,
                            "invalidates" : 0,
                            "docsExamined" : 676745,
                            "alreadyHasObj" : 0,
                            "inputStage" : {
                                    "stage" : "IXSCAN",
                                    "nReturned" : 676745,
                                    "executionTimeMillisEstimate" : 980,
                                    "works" : 676746,
                                    "advanced" : 676745,
                                    "needTime" : 0,
                                    "needYield" : 0,
                                    "saveState" : 8970,
                                    "restoreState" : 8970,
                                    "isEOF" : 1,
                                    "invalidates" : 0,
                                    "keyPattern" : {
                                            "id" : 1,
                                            "ts" : -1
                                    },
                                    "indexName" : "id_1_ts_-                                                                   1",
                                    "isMultiKey" : false,
                                    "isUnique" : false,
                                    "isSparse" : false,
                                    "isPartial" : false,
                                    "indexVersion" : 1,
                                    "direction" : "forward",
                                    "indexBounds" : {
                                            "id" : [
                                                    "[\"#####ID#####\", \"#####ID#####\"]"
                                            ],
                                            "ts" : [
                                                    "(new Date(1475272800000), new Date(1474581600000)]"
                                            ]
                                    },
                                    "keysExamined" : 676745,
                                    "dupsTested" : 0,
                                    "dupsDropped" : 0,
                                    "seenInvalidated" : 0
                            }
                    }
            },
            "allPlansExecution" : [ ]
    },
    "serverInfo" : {
            "host" : "ip #########",
            "port" : 27017,
            "version" : "3.2.10",
            "gitVersion" : "79d9b3ab5ce20f51c272b4411202710a082d0317"
    },
    "ok" : 1

}

正如我们在上面看到的,mongoDb使用索引。 IXSCAN需要 980ms FETCH ~160000ms

如果我不误认为整个读取应该是676746(nReturned)* 329(avgObjSize)Bytes = ~212 MB的数据。

我注意到在 iostats http://linuxcommand.org/man_pages/iostat1.html)中,以下内容(/ data / db在xvdf上):

  vg-cpu:  %user   %nice %system %iowait  %steal   %idle
           0.27    0.00    0.00   21.35    0.13   78.25
Device:         rrqm/s   wrqm/s     r/s     w/s    rMB/s    wMB/s avgrq-sz avgqu-sz   await r_await w_await  svctm  %util
xvda              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00    0.00    0.00   0.00   0.00
xvdf              0.00     0.00 1691.00    0.00    19.83     0.00    24.02     0.95    0.56    0.56    0.00   0.56  94.40

rMB / s在整个操作(获取阶段)期间表示~20MB / s并且这是连续的。这意味着mongodb正在读取160 s * 20MB / s = 3 200 MB,这超过了200 MB以上。

内存:

    free -m
             total       used       free     shared    buffers     cached
   Mem:         16048      12629       3418          0         32       4071
   -/+ buffers/cache:       8525       7522
  Swap:            0          0        

mongodb还没有使用配置的5000 iops EBS,也没有承诺带宽? 仅使用~1700读/秒导致~20MB / s。

我已将预读更改为16KB。我曾尝试将日志和日志放在另一个硬盘上。

我无法弄清楚这一点! 帮我。 请!

1 个答案:

答案 0 :(得分:2)

主要事实是:

  • 本机有16 GB的RAM
  • 有问题的集合是112 GB未压缩(约51 GB压缩)
  • 集合的索引总大小约为7 GB
  • 该集合包含367,614,513份文件
  • 大部分时间用于获取投影文档。这需要166470毫秒(~166秒)。查询的索引扫描仅需980毫秒(<1秒)。

假设WiredTiger缓存设置为默认值,则为WiredTiger缓存保留的RAM量应约为8.6 GB。在https://docs.mongodb.com/v3.2/faq/storage/#to-what-size-should-i-set-the-wiredtiger-internal-cache

  

从MongoDB 3.2开始,WiredTiger内部缓存默认使用较大的一个:

     
      
  • 60%的RAM减去1 GB,或
  •   
  • 1 GB。
  •   

根据上述信息,您的计算机上似乎存在内存压力。 MongoDB尝试将索引保留在内存中以便快速访问,整个索引大约为7 GB。这将仅使用索引有效地填充约80%的WiredTiger缓存,为其他任何东西留下很小的空间。因此,MongoDB被迫从磁盘中提取结果集中的文档。此时,性能会受到影响。

您可以在iostat输出中看到此效果,其中设备xvdf(数据所在的位置)的利用率超过94%(显示在%util列中) ,这意味着您的操作受I / O约束,因为您没有足够的RAM来满足您理想的工作集。

要缓解此问题,您可以尝试:

  • 为部署配置更大的RAM
  • 如果适用,请使用光标返回文档,而不是一次性尝试访问整个结果集

您还可以查看Production NotesOperation Checklist以了解推荐设置。