如何仅在Apache配置单元中运行映射作业的查询

时间:2014-12-02 09:50:20

标签: hive

如果我在Apache hive中编写一个查询,那么它会在场景后面执行mapreduce工作,但是如何在hive中只运行map job?

由于

2 个答案:

答案 0 :(得分:0)

某些优化查询实际上只需要映射阶段。您可以在Hive中提供<​​strong> MAPJOIN 提示以实现相同的目的:建议用于小型辅助表:

 SELECT /*+ MAPJOIN(...) */ * FROM ...

答案 1 :(得分:0)

这是一个在接受采访时向我询问的问题,我当时并不知道答案,但后来才知道答案。

以下查询运行仅限Map的作业。因此,选择列值将仅运行map job.Hence我们不需要此方案的reducer。

  select id,salary from tableA;