mapPartition与地图有何不同?

时间:2017-03-10 19:39:44

标签: apache-spark

我知道mapPartition转换和地图是什么。有些帖子声称mapPartition比map快。在什么情况下我们使用mapPartition而不是map? mapPartition与map相比真的很快吗?

1 个答案:

答案 0 :(得分:1)

方法映射通过应用函数将源RDD的每个元素转换为结果RDD的单个元素。 mapPartitions将源RDD的每个分区转换为结果的多个元素(可能没有)。

这里已经回答: Apache Spark: map vs mapPartitions?