应用错误收集

在火花中，是否存在GroupByKey优于ReduceByKey的情况？

时间：2018-09-05 22:00:34

标签： apache-spark rdd

用ReduceByKey替换GroupByKey是众所周知的优化，因为后者减少了改组。我想知道是否有相反的情况，使用GroupByKey的代码比使用ReduceByKey的代码要快。

0 个答案:

没有答案