在HDFS中创建具有多个连接的动态查询

时间:2017-10-31 14:22:45

标签: hbase hdfs bigdata phoenix schema-design

我的用例是我想创建一个报告工具,其中包含大约200个表,每个表包含数百万行和100列。表之间将有多个连接以最终创建报告。 用户将有多个字段可供选择并从中创建报告。因此,查询将在运行时生成。 我想了解,什么是可用于此目的的最佳可能的大数据技术。 当前的RDBMS可能无法在如此高的数据量下扩展。 我们可以将所有数据转储到HDFS,但是我们如何在其上实现连接,这样报告应用程序的性能不会受到太大影响。 任何真实的实现或链接或具有类似用例的论文都将帮助我节省大量时间。

0 个答案:

没有答案