使用Impala超过4个月,我们发现在大多数情况下它与蜂巢相比非常快。由于我们正在评估Hadoop中用于数据处理的快速框架,因此想知道它们是否在本机Hadoop环境中的任何框架都比impala更快。(可以是任何类型,内存或MR1或基于纱线!)全面的清单会有所帮助。
答案 0 :(得分:0)
Impala在速度方面是一个不错的选择。对于标准的Map / Reduce环境,您不太可能找到更好的环境:impala能够缓存数据块,并且即使从磁盘读取未缓存的块,也比M / R快得多。但当然,考虑到你有几个月的黑斑羚经验 - 你已经知道了。 AFAIK没有另一种使用原生hadoop结构的近实时蜂巢访问机制。