Spark集群中的Hive查询

时间:2018-09-28 11:39:32

标签: apache-spark hive

我需要了解如何在Spark集群中执行配置单元查询。它可以作为在内存中运行的Mapreduce作业运行,也可以使用spark架构运行配置单元查询。请澄清。

2 个答案:

答案 0 :(得分:1)

如果在hive或beeline中运行hive查询,它将使用Map-reduce,但是,如果在spark REPL或程序中运行hive查询,则查询将简单地转换为数据帧,并创建与数据帧相同的逻辑和物理计划,执行。因此将使用火花的所有力量。

答案 1 :(得分:1)

假设您具有配置了YARN和Spark的Hadoop集群;

配置单元执行引擎由hive.execution.engine属性控制。根据{{​​3}},它可以是mr(默认),tezspark