Question

如果我在Apache hive中编写一个查询，那么它会在场景后面执行mapreduce工作，但是如何在hive中只运行map job？

由于

Answer 1

某些优化查询实际上只需要映射阶段。您可以在Hive中提供<strong> MAPJOIN 提示以实现相同的目的：建议用于小型辅助表：

 SELECT /*+ MAPJOIN(...) */ * FROM ...

Answer 2

这是一个在接受采访时向我询问的问题，我当时并不知道答案，但后来才知道答案。

以下查询运行仅限Map的作业。因此，选择列值将仅运行map job.Hence我们不需要此方案的reducer。

  select id,salary from tableA;