在火花中,是否存在GroupByKey优于ReduceByKey的情况?

时间:2018-09-05 22:00:34

标签: apache-spark rdd

用ReduceByKey替换GroupByKey是众所周知的优化,因为后者减少了改组。我想知道是否有相反的情况,使用GroupByKey的代码比使用ReduceByKey的代码要快。

0 个答案:

没有答案