标签: apache-spark
reduce(lambda x,y: x.union(y), myRDDlist)
调用RDD.union和
sc.union(myRDDlist)
调用SparkContext.union?
他们编译成相同的代码吗?
答案 0 :(得分:6)
SparkContext.union和RDD.union是等效的。
减少RDD列表并调用RDD.union将导致多个嵌套的UnionRDD(相互引用),其中对SparkContext.union的调用将只产生一个UnionRDD。