标签: apache-spark mapreduce rdd
我已经阅读了groupbykey和reducebykey之间的区别,还了解了与groupbykey相比reducebykey如何产生更好的性能。谁能告诉我用例,哪里应该使用groupbykey而不是reducebykey。