RDD.union vs SparkContext.union

时间:2015-03-20 18:11:46

标签: apache-spark

之间有什么区别
reduce(lambda x,y: x.union(y), myRDDlist)

调用RDD.union

sc.union(myRDDlist)

调用SparkContext.union

他们编译成相同的代码吗?

1 个答案:

答案 0 :(得分:6)

如果您有两个RDD,则

SparkContext.unionRDD.union是等效的。

减少RDD列表并调用RDD.union将导致多个嵌套的UnionRDD(相互引用),其中对SparkContext.union的调用将只产生一个UnionRDD。