如何加快我的mongodb测试?

时间:2012-03-08 15:37:43

标签: java mongodb spring-data

从我的测试中,我得到大约500个插入,200个查询,每秒400次更新。我想知道我可以调整什么来增加这些数字。

我已经读过其他人可以在他们的测试中获得数千甚至数万个插件,这比我的测试要好得多。我想知道我是否遗漏了一些基本的东西?

所以,这是事实:

  • 我正在使用默认配置
  • 的32位mongodb v2.0.3
  • 带有spring mongo的Java驱动程序(2.7.3),(我不强迫fsync)
  • 执行插入和原子更新的组合,例如push,pull, inc,dec,set,
  • 并重复所有这些500k次。
  • 目的是模拟插入和更新等用户操作
  • 没有定义任何特定的索引,但我认为默认情况下,id始终是id的唯一索引?
  • 在eclipse IDE中运行的java应用程序与mongod服务器在同一台机器上运行
  • H / W规格:核心i5,mem 4GB,thinkpad edge
  • 我注意到java进程大约需要280MB,并且在循环过程中该数字是稳定的

开始时间是:2012-03-08 21:50:16

我使用mongostat进行监控,在到达22:05:10的时间后,我终止了未完成的应用程序..这里是mongostat的最后一个输出

insert  query update delete getmore command flushes mapped  vsize    res faults locked % idx miss %     qr|qw   ar|aw  netIn netOut  conn       time
   499    200    400      0       0     100       0  1023m  1.06g   581m    145      8.5          0       0|0     0|0   645k    97k     3   22:05:01
   503    201    403      0       0     102       0  1023m  1.06g   582m    154     10.7          0       0|0     0|1   651k    98k     3   22:05:02
   520    208    415      0       0     105       0  1023m  1.06g   582m    176     11.1          0       0|0     0|0   671k   101k     3   22:05:03
   504    202    403      0       0     102       0  1023m  1.06g   582m    167      7.2          0       0|0     0|0   651k    98k     3   22:05:04
   524    209    419      0       0     106       0  1023m  1.06g   582m    147      8.3          0       0|0     0|0   675k   102k     3   22:05:05
   534    213    428      0       0     107       0  1023m  1.06g   583m    176      7.4          0       0|0     0|0   690k   103k     3   22:05:06
   531    213    424      0       0     108       0  1023m  1.06g   584m    160      4.9          0       0|0     0|0   685k   104k     3   22:05:07
   533    213    427      0       0     107       0  1023m  1.06g   584m    164      6.9          0       0|0     0|0   689k   103k     3   22:05:08
   518    208    414      0       0     105       0  1023m  1.06g   585m    158      7.3          0       0|0     0|0   669k   101k     3   22:05:09
   521    208    417      0       0     105       0  1023m  1.06g   585m    154      4.7          0       0|0     0|0   673k   101k     3   22:05:10

然后我检查了我的插入号码:

> db.myCollection.find().size();
90575

这是我插入的文档的一个示例,在此过程中也会更新等

> db.myCollection.findOne().pretty();
{
        "_id" : "b146189a-56a4-4035-8245-c4bd6dc2bd22",
        "something1" : "my class is cool !",
        "something2" : {
                "value" : "this is a statement blah blah",
                "name" : "myStatement"
        },
        "something3" : {
                "size" : {
                        "value" : 0,
                        "name" : "size"
                },
                "value" : [
                        "6810cb0c-fa3e-4ca9-8a27-8432f2d1e828",
                        "a8276d05-a796-4c43-bc74-edc06d074099"
                ],
                "name" : "myids"
        },
        "something4" : {
                "myattr" : {
                        "value" : "something",
                        "name" : "name"
                },
                "attr" : {
                        "content" : {
                                "value" : "another another body body content content",
                                "name" : "content"
                        },
                        "contentId" : "b146189a-56a4-4035-8245-c4bd6dc2bd22",
                        "name" : "something"
                },
                "subsubchildchild" : {
                        "size" : {
                                "value" : 0,
                                "name" : "size"
                        },
                        "value" : [ ],
                        "name" : "subBodies"
                },
                "myId" : "b146189a-56a4-4035-8245-c4bd6dc2bd22",
                "name" : "hiccups"
        },
        "something5" : {
                "value" : false,
                "name" : "hahaha"
        },
        "something6" : {
                "name" : "okay this is just a test"
        },
        "something7" : {
                "value" : false,
                "name" : "remove me !"
        },
        "something8" : {
                "size" : {
                        "value" : 0,
                        "name" : "size"
                },
                "value" : [ ],
                "name" : "guess what"
        },
        "something9" : {
                "size" : {
                        "value" : 0,
                        "name" : "anotherSize"
                },
                "value" : [ ],
                "name" : "tarantula"
        },
        "something10" : {
                "value" : 8,
                "name" : "my exam score"
        },
        "something11" : {
                "size" : {
                        "value" : 0,
                        "name" : "justAnotherSize"
                },
                "value" : [ ],
                "name" : "myReference"
        },
        "something12" : {
                "size" : {
                        "value" : 0,
                        "name" : "size"
                },
                "value" : [ ],
                "name" : "myOtherReference"
        },
        "something13" : {
                "value" : "8b78fff0-50f5-4992-9972-89f9d944fee7",
                "name" : "user"
        },
        "something14" : {
                "dateTime" : "2012-03-08 21:50:17.480000000"
        },
        "something15" : {
                "value" : false,
                "name" : "lovely"
        }
}

这是我的db stat:

> db.stats();
{
        "db" : "qa",
        "collections" : 7,
        "objects" : 815197,
        "avgObjSize" : 622.2093211824872,
        "dataSize" : 507223172,
        "storageSize" : 610770944,
        "numExtents" : 57,
        "indexes" : 5,
        "indexSize" : 64197952,
        "fileSize" : 1056702464,
        "nsSizeMB" : 16,
        "ok" : 1
}

另外一个好奇心的问题......从我的主要收藏规模来看,它有大约9万条记录,以及其他非实质性的收藏品,它们的大小不大,在这种情况下大约有1TB的fileSize是合理的吗?有什么办法可以帮助减少我的文件大小吗?

请分享您的想法。

1 个答案:

答案 0 :(得分:2)

你似乎在mongostat上遇到了很多错误。知道为什么吗?

  

执行插入和原子更新的组合,例如push,pull,inc,dec,set

您是如何发布这些更新的?到_id

  

我已经读过其他人可以在他们的测试中获得数千甚至数万个插件,这比我的测试要好得多。我想知道我是否遗漏了一些基本的东西?

根据mongostat,您只有3个连接处于活动状态且锁定率仅为10%左右。

  • 您是否多线程输入?
  • 你是否在同一台计算机上破坏了这一切?
  • 系统IO如何?
  • 你在做WriteConcern.Safe

这些都是可能影响吞吐量的注意事项。

  

在这种情况下大约有1TB的fileSize是否合理?

基于db.stats(),您只能使用大约600 MB的磁盘。

"storageSize" : 610770944 // = 610,770,944

您的平均对象大小为622字节,但您有815,197个对象,而不是您声称拥有的90k文档。

  

我能做些什么来帮助减少我的文件大小?

是的,减小JSON文档中Keys的大小。例如:

"something1" : "my class is cool !"  => ~28 bytes
"s1": "my class is cool !"           => ~20 bytes

确保您正确存储缩短的名称,并让数据访问框架解除将这些名称映射到更合理的名称。