如果我在Apache hive中编写一个查询,那么它会在场景后面执行mapreduce工作,但是如何在hive中只运行map job?
由于
答案 0 :(得分:0)
某些优化查询实际上只需要映射阶段。您可以在Hive中提供<strong> MAPJOIN 提示以实现相同的目的:建议用于小型辅助表:
SELECT /*+ MAPJOIN(...) */ * FROM ...
答案 1 :(得分:0)
这是一个在接受采访时向我询问的问题,我当时并不知道答案,但后来才知道答案。
以下查询运行仅限Map的作业。因此,选择列值将仅运行map job.Hence我们不需要此方案的reducer。
select id,salary from tableA;