标签: hadoop hive hdfs
我们有将csv(> 900 GB)数据文件存储在HDFS文件系统中的情况,在该系统中定义了Hive 0.14表。我们需要对数据执行一些分析查询以及对数据执行更新。基本上是这个数据量上的RDBMS类系统。任何人都可以建议什么是RDBMS系统(更新,选择)的潜在选项,保持头脑性能是一个重要的标准。
答案 0 :(得分:0)
PostgreSQL是从EDL加载数据的绝佳选择。您可以将热数据放在那里执行一些快速查询。