标签: database database-administration emr amazon-emr
我正在尝试建立一个报告系统,但遇到问题缓慢的问题,我很乐意听取您的建议: 我应该使用哪个DB(或任何其他大数据解决方案)来支持: - 每15分钟一次ETL - 每天300M行 - 来自Web应用程序的查询应在~20秒内返回。
目前我在ORC表上使用带有日期分区的EMR,但即使在1维上运行带分组的查询并对度量进行求和,也需要超过1分钟。
由于
答案 0 :(得分:0)
以下是AWS ReInvent的数据库+搜索层的一些很好的讨论:
https://youtu.be/K7o5OlRLtvU?t=1574
我应该使用哪种数据存储?