什么类型的数据库适用于数百万行的实时聚合操作

时间:2017-12-04 05:11:35

标签: database cassandra nosql teradata rdbms

我需要存储15-30百万行数据。大多数查询将按操作分组(聚合)。我目前正在使用Teradata作为数据库后端。但响应时间不是实时的(一些查询大约需要30秒)。我正在考虑将Cassandra作为替代品,但在一些文档中,我发现如果按操作分组,那么Cassandra不是最好的选择。

哪个数据库最适合我的用例,因为一次最多100个用户将使用该应用程序(以及并行发生的数据更新)?任何传统的RDBMS都可以满足这种要求吗?

任何帮助将不胜感激。提前谢谢。

2 个答案:

答案 0 :(得分:0)

Cassandra本身对聚合不太好,考虑一下Cassandra + Storm / Spark

答案 1 :(得分:0)

Teradata旨在处理具有并行性的非常大的数据集,并且应该大致线性扩展。换句话说,为资源限制的查询添加更多的马力并获得更好的性能。

您目前的30秒查询有哪些瓶颈?您可以使用EXPLAIN发布示例查询来查看吗?可能是快速优化会加速它 - 统计,索引选择,连接索引,PPI(表分区)等。