zipPartitions:强制两个分区都保留在同一执行程序上

时间:2018-07-12 10:21:51

标签: scala apache-spark

比方说,我有2个zipPartitions,每个分区都被分区并且每个持久化。

现在,我正在呼叫RDD,以遍历每对partition0的分区。

有没有办法确保最少的数据传输?也就是说,我可以确保RDD1的{​​{1}}与partition0的{​​{1}}保留在同一位置吗?等等。

0 个答案:

没有答案