Apache Drill的性能

时间:2015-08-22 06:44:38

标签: hadoop hive impala apache-drill apache-tez

有没有比较Stinger vs Impala vs Drill的性能基准(真实的)?此外,这是首选 - 我的用例将主要针对Hive上的临时交互式查询。感谢。

1 个答案:

答案 0 :(得分:2)

你不能像这样做基准,没有意义,你永远不应该相信这样的基准。

一切都取决于你自己的数据,你有JSON文件?喜欢钻。您想要查询超过1TB,更喜欢Hive等等。

此外,您可以考虑文件格式,JSON,Kudu,Parquet或ORC。

然后进行优化,Hive + Tez似乎更适合parrarel查询,但对于单个查询来说非常慢。而Impala则相反(MapReduce与MassiveParrarelProcessing)。

此外,您还要考虑硬件资源,磁盘SSD等等。

我建议,从Apache Drill + JSON文件开始,然后尝试使用Parquet或ORC进行Apache Drill。

如果您需要帮助,请准确描述您拥有的内容(数据+硬件)以及您想要的内容。