标签: apache-spark
正如标题所描述的那样,火花中的功能就像hadoop组合功能一样,用于减少随机数据传输。在此先感谢。
答案 0 :(得分:1)
你想使用aggregateByKey它有一个combOp的参数,它与一个组合器相同。在大多数写得很干净的代码中,reduceByKey会自动使用reduce函数作为组合器