关于在蜂巢中按/ cluster by进行排序,我并没有明确的认识
根据我的理解,当我们在蜂巢中使用by by by / cluster by sort进行分发时,会使用多个reduce,
但是为什么要对列进行排序需要reduce,排序可以通过映射完成,并且不涉及任何聚合函数
它与创建表时使用的排序依据有什么关系吗
我面临的问题是
从order_items集群中选择*,按order_item_order_id限制10;
对于上述查询,即使我使用命令,减速器的数量也不会改变,
设置mapreduce.job.reduce = 4
它仍然为1
you can see here ,even though your change reducer count ,it still remains 1
尽管有与此相关的帖子,但给出的答案并不能消除我的疑问。 预先感谢...。