标签: scala apache-spark
比方说,我有2个zipPartitions,每个分区都被分区并且每个持久化。
zipPartitions
现在,我正在呼叫RDD,以遍历每对partition0的分区。
RDD
partition0
有没有办法确保最少的数据传输?也就是说,我可以确保RDD1的{{1}}与partition0的{{1}}保留在同一位置吗?等等。
RDD1