标签: apache-spark rdd
用ReduceByKey替换GroupByKey是众所周知的优化,因为后者减少了改组。我想知道是否有相反的情况,使用GroupByKey的代码比使用ReduceByKey的代码要快。