有没有比较Stinger vs Impala vs Drill的性能基准(真实的)?此外,这是首选 - 我的用例将主要针对Hive上的临时交互式查询。感谢。
答案 0 :(得分:2)
你不能像这样做基准,没有意义,你永远不应该相信这样的基准。
一切都取决于你自己的数据,你有JSON文件?喜欢钻。您想要查询超过1TB,更喜欢Hive等等。
此外,您可以考虑文件格式,JSON,Kudu,Parquet或ORC。
然后进行优化,Hive + Tez似乎更适合parrarel查询,但对于单个查询来说非常慢。而Impala则相反(MapReduce与MassiveParrarelProcessing)。
此外,您还要考虑硬件资源,磁盘SSD等等。
我建议,从Apache Drill + JSON文件开始,然后尝试使用Parquet或ORC进行Apache Drill。
如果您需要帮助,请准确描述您拥有的内容(数据+硬件)以及您想要的内容。