我是一个非SQL结构的初学者,就像在这里使用MongoDB一样,我找不到有人谈论有大量数据的集合,比如1.000.000条目?和更多 ?
我在official site上看到了一个公司页面。但与大型数据公司无关。
我听说过SQL的组合:大数据存储在SQL表中,只有"缓存"在MongoDB上,但它是MongoDB和大数据的唯一解决方案吗?
答案 0 :(得分:3)
我们正在使用MongoDB为Where's it Up和api behind it提供支持。我们目前每天推出大约300万份文档。 MongoDB是唯一使用的存储引擎。我们暂时保持了一段时间,但我们现在正在使用TTL来删除旧记录。
事情进展顺利,只要确保你拥有所需的所有索引。无论您的存储引擎如何,查询没有索引的百万条+记录都是不好的。自动故障转移非常有用。
要注意的是更新记录以包含更多信息,如果文档增长超过预先分配的空间,则可能相当昂贵。我们最终改变了存储数据的方式以避免更新,并改为创建新文档。
答案 1 :(得分:1)
MongoDB中的当前版本是明确设计的,可以轻松扩展。
至于数字:我的一个测试数据库有10M记录,可以在我的MacBook Air上轻松运行,现在已经有4年了。
因此,当您的当前集群无法处理存储的数据时(无论是因为索引对于RAM来说太大还是因为处理查询需要太长时间),您可以执行的操作:将另一个节点添加到MongoDB集群。你的性能增益应该略低于线性(如果你的集群处于完美状态),高达几个数量级(当指数不适合RAM和/或IO被推到它的限制之前,并且这种情况发生了变化之后)缩小)。
警告:如果您希望将部署投入生产,您应该有一些了解MongoDB管理的人。尽管MongoDB管理似乎很容易,但绝不是一个外行人要做的事情。特别是不适合生产使用。