“Hive on Spark”与“Spark SQL with Hive Metastore”有什么区别?在生产中,应该使用哪一个?为什么?

时间:2017-07-18 02:48:10

标签: apache-spark hive apache-spark-sql

这是我的意见:

  

Hive on Spark为Hive提供了利用Apache Spark作为其执行引擎的能力.Spark SQL还支持读取和写入存储在Apache Hive中的数据.Hin上的Spark仅使用Spark执行引擎。带有Hive Metastore的Spark SQL不仅使用Spark执行引擎,还使用Spark SQL这是一个Spark模块,用于结构化数据处理和执行SQL查询。由于Spark SQL with Hive Metastore不支持所有Hive配置和所有版本的Hive Metastore(可用版本为0.12.0到1.2.1。),在生产中,Hive on Spark的部署模式更好,更有效

所以,我错了吗?有没有人有其他想法?

0 个答案:

没有答案