通过/ cluster按明确的想法进行排序

时间:2018-11-21 07:21:22

标签: hive bigdata hiveql

关于在蜂巢中按/ cluster by进行排序,我并没有明确的认识

根据我的理解,当我们在蜂巢中使用by by by / cluster by sort进行分发时,会使用多个reduce,

但是为什么要对列进行排序需要reduce,排序可以通过映射完成,并且不涉及任何聚合函数

它与创建表时使用的排序依据有什么关系吗

我面临的问题是

从order_items集群中选择*,按order_item_order_id限制10;

对于上述查询,即使我使用命令,减速器的数量也不会改变,
设置mapreduce.job.reduce = 4

它仍然为1

you can see here ,even though your change reducer count ,it still remains 1

尽管有与此相关的帖子,但给出的答案并不能消除我的疑问。 预先感谢...。

0 个答案:

没有答案