我有一个关于Hive查询执行的问题。
假设我有一个查询:
从表中选择*,其中id> 5;
现在,此查询将转换为树,然后拆分为较小的任务,并分发到具有该特定数据的数据节点。
现在,当分发查询时,整个查询是否会分发到具有数据的所有节点?或者它只将一部分查询发送给节点?
如果它将整个查询发送到所有节点,数据节点是否只处理查询的一部分或整个查询?
如果是上述情况,那么数据节点processi的用途是什么
答案 0 :(得分:0)
Hive根据您提交的查询生成MapReduce作业或多个MapReduce作业。然后,Hadoop JobTracker根据Hadoop用于分发MapReduce作业任务的算法分发MapReduce作业。
希望这有帮助。