如何在Spark 2.1中启用钨排序shuffle?

时间:2017-07-05 20:08:30

标签: apache-spark shuffle

在以前的版本中,有一个名为 spark.shuffle.manage 的配置,用于确定Spark中的随机数算法的类型。从Spark 2.0开始,此配置将被删除。默认的shuffle算法是基于排序的。据我了解,只有满足所有要求时才会启用Tungsten shuffle。如何知道当前作业是使用原始的基于排序的shuffle还是Tungsten sort?

非常感谢。

1 个答案:

答案 0 :(得分:2)

引用SortShuffleManager — The Default (And Only) Sort-Based Shuffle System

  

SortShuffleManager是Spark中唯一一个短名为sorttungsten-sort的ShuffleManager。

换句话说,你无法使用任何其他ShuffleManager而是SortShuffleManager(除非你使用spark.shuffle.manager属性启用了一个)。