Apache Tajo和Apache hive之间的实际区别是什么

时间:2016-04-12 18:55:52

标签: apache hadoop hive apache-tajo bigdata

最近正在开发 Apache Tajo项目。该项目的目标是“Hadoop中用于处理Web级数据集的高级开源数据仓库系统”

由于我们已经将Apache hive作为hadoop的数据仓库,现在已经进步并广泛使用,这个新项目对于hadoop世界有多么有用和不同?

1 个答案:

答案 0 :(得分:0)

如果你已经把你的仓库稳定在Hive上,我很确定你不必在短期内搬走。 Tajo试图访问的几个区域是:

  1. 低延迟查询(ad-hoc):使用Impala / Tez可能会获得足够快的结果,并且CDH 5.7会带来hive-on-spark。为了更快的响应,可以使用不同的DB(通常不是DWH)。
  2. 完整的SQL支持:只要使用配置单元的人已经熟悉HQL,就不需要SQL了。虽然您可以很容易地理解为什么获得全sql支持会带来好处。