是否有任何多核开发NoSQL系统?

时间:2010-10-03 00:57:34

标签: mongodb database nosql

我从昨天开始玩MongoDB并且非常喜欢它。我正在尝试导入大量数据(20亿行)并对其进行索引,但它似乎没有使用我的系统所具有的8个核心,导入正常率(60000记录/秒)。我只能想象在这个集合中索引两列可能需要多长时间。是否有任何MondoDB类型的数据库利用CPU的多核特性?

1 个答案:

答案 0 :(得分:9)

如果MongoDB有一个致命弱点,那就是它只支持单线程写入和单线程映射缩减。

与往常一样,这里有一些权衡。单线程写入是避免锁定问题和最小化开销的最简单方法。以同样的方式,多线程map-reduced是锁定数据的好方法。因此,生产系统上的单线程映射减少可能更容易,更安全。

但是,你不是没有工具。 MongoDB将为每个实例提供一个写入线程。因此,如果您对MongoDB进行分片,那么您将为每个分片获得一个写入线程。

如果你想要20亿行的多个索引,你还是要看看分片。这里有一些快速数学:MongoID是12个字节。 MongoID的索引是2B * 12字节= 22GB +。如果你现在想要再添加两个索引(甚至只是两个4字节整数),我们每个人都在谈论7.5GB。

所以在2B行中,你所说的索引中有超过37GB(最小)。在大多数8核服务器上,这意味着您甚至无法将索引保留在内存中,更不用说任何数据了。

因此,如果您想要在这里表现出色,那么您将需要开始查看分片。只是基于一般数字。对于FWIW,MySQL将不再擅长处理2B文档。有了那么多数据,你真的希望有多台服务器来跟上负载。