应用错误收集

是不是MapReduce中的混乱一词具有误导性？

时间：2018-04-13 16:42:32

标签： hadoop group-by mapreduce shuffle hadoop-partitioning

我认为术语 shuffle 是指在序列[1]中随机重新排序元素。因此，我第一次看到MapReduce中的混乱时，我认为它试图将工作负载统一分配到节点以实现负载均衡。然而，在阅读细节之后，我意识到它并不是我想象的那样。它不是随机的，更像是SQL中的group by。

那么使用术语改组的动机是什么？由于我是MapReduce的新手，因此我很可能错过了一些东西。我全都耳朵。

0 个答案:

没有答案