数据库架构建议报告仪表板

时间:2017-02-08 22:37:30

标签: database database-administration emr amazon-emr

我正在尝试建立一个报告系统,但遇到问题缓慢的问题,我很乐意听取您的建议: 我应该使用哪个DB(或任何其他大数据解决方案)来支持: - 每15分钟一次ETL - 每天300M行 - 来自Web应用程序的查询应在~20秒内返回。

目前我在ORC表上使用带有日期分区的EMR,但即使在1维上运行带分组的查询并对度量进行求和,也需要超过1分钟。

由于

1 个答案:

答案 0 :(得分:0)

以下是AWS ReInvent的数据库+搜索层的一些很好的讨论:

https://youtu.be/K7o5OlRLtvU?t=1574

我应该使用哪种数据存储?

enter image description here

相关问题