我最近遇到了一个问题
是否会将所有Hive查询转换为地图并减少作业?
我知道Hive查询被转换为一系列Map Reduce作业。我不是在讨论在Hive中调用外部脚本。 是否存在不需要减少作业的情况,Hive可以通过Map作业本身来实现结果。
你有什么想法?
答案 0 :(得分:3)
是肯定的。这取决于您正在运行的工作类型。
例如,如果您有一个包含架构的员工表(名称,ID,部门)。
以下查询运行仅限Map的作业。 Mapper从hive表中接收(Name,id,department)作为值,它发出Name,Nullwritable。 因此,我们不需要减少这种情况。
select Name from employee;