如何管理MongoDb集合中的大数据

时间:2017-02-15 14:23:25

标签: node.js mongodb mongodb-query

我有一个名为数据的集合,它是每个 n 秒从许多设备发送的所有文档的目的地。

在没有文档溢出的情况下,在生产中保持集合的最佳做法是什么?

我怎么能"清洁"收集并保存另一个内容?这是正确的方法吗?

提前谢谢。

2 个答案:

答案 0 :(得分:1)

Mongodb是存储大型集合的最佳数据库。您可以执行以下步骤以获得更好的性能。

  • 复制

复制意味着在单个服务器或多个服务器上多次复制数据。 每次在数据库中插入数据时,它都会提供数据备份。

嵌入式文档

尝试使用refreences进行收藏。这意味着尝试在数据库中进行引用。

答案 1 :(得分:1)

你不能溢出,如果你使用分片,你几乎没有空间。

https://docs.mongodb.com/manual/reference/limits/#Sharding-Existing-Collection-Data-Size

这些是单个分片的限制,您必须在到达它们之前开始分片。

这取决于您的体系结构,但是对于大多数甚至大数据应用程序来说,无法达到8.19200艾字节(或8,192,000太字节)的限制(如果您将副本集中可能的碎片数乘以最大集合大小)他们。

另见:

What is the max size of collection in mongodb