应用错误收集

你不能像这样做基准，没有意义，你永远不应该相信这样的基准。

一切都取决于你自己的数据，你有JSON文件？喜欢钻。您想要查询超过1TB，更喜欢Hive等等。

此外，您可以考虑文件格式，JSON，Kudu，Parquet或ORC。

然后进行优化，Hive + Tez似乎更适合parrarel查询，但对于单个查询来说非常慢。而Impala则相反（MapReduce与MassiveParrarelProcessing）。

此外，您还要考虑硬件资源，磁盘SSD等等。

我建议，从Apache Drill + JSON文件开始，然后尝试使用Parquet或ORC进行Apache Drill。

如果您需要帮助，请准确描述您拥有的内容（数据+硬件）以及您想要的内容。