Hive查询作为仅映射作业执行

时间:2015-04-16 21:44:20

标签: hadoop mapreduce hive hiveql hadoop2

我最近遇到了一个问题

  

是否会将所有Hive查询转换为地图并减少作业?

我知道Hive查询被转换为一系列Map Reduce作业。我不是在讨论在Hive中调用外部脚本。 是否存在不需要减少作业的情况,Hive可以通过Map作业本身来实现结果。

你有什么想法?

1 个答案:

答案 0 :(得分:3)

是肯定的。这取决于您正在运行的工作类型。

例如,如果您有一个包含架构的员工表(名称,ID,部门)。

以下查询运行仅限Map的作业。 Mapper从hive表中接收(Name,id,department)作为值,它发出Name,Nullwritable。 因此,我们不需要减少这种情况。

select Name from employee;