3亿条记录-索引和搜索功能

时间:2019-01-26 18:22:15

标签: mongodb apache-spark cassandra amazon-emr large-data

我们遇到一种情况,我们想知道哪种服务最适合我们的情况。

我们确实有3亿条记录,每天将增加或删除约10万条记录,我们希望拥有最好的索引和搜索功能。我们每天将向该数据集查询大约1万至30万。

数据为字母数字,最少2个字符,最多128个字符,并且数据库中只有一个列包含3亿条记录。

我们想知道什么是满足我们需求的最佳解决方案。您推荐哪个数据库或服务?

1 个答案:

答案 0 :(得分:0)

在很多事情上都感到沮丧 例如 您如何查找要删除的数据?如果有ID,是否可以直接访问数据并使用cassandra删除它,而且cassandra在插入数据方面也具有最佳性能

或者,如果您有历史数据,例如传感器或状态变化的历史,则应使用cassandra,因为mongo不会为历史数据设计

使用mongo,我需要搜索您的数据,或者您的数据没有结构,或者您有一个大型json。