标签: apache-spark
我知道mapPartition转换和地图是什么。有些帖子声称mapPartition比map快。在什么情况下我们使用mapPartition而不是map? mapPartition与map相比真的很快吗?
答案 0 :(得分:1)
方法映射通过应用函数将源RDD的每个元素转换为结果RDD的单个元素。 mapPartitions将源RDD的每个分区转换为结果的多个元素(可能没有)。
这里已经回答: Apache Spark: map vs mapPartitions?