假设我们有一个RDD rddBefore
,在某些地图操作后变成rddAfter
。 partitionBefore
中的一个分区rddBefore
对应partitionAfter
中的rddAfter
。
由于火花可能会在计算过程中降低地点,因此partitionBefore
和partitionAfter
可以分布在不同的计算机上,例如m1
和m2
。
在rddBefore.zip(rddAfter)
之后,哪台机器(partitionBefore, partitionAfter)
会被分发到哪里?
由于
答案 0 :(得分:1)
有两种可能的情况:
preferredLocations
重叠,这些位置将被用作孩子的首选位置。preferredLocations
的联合(不首选父项)。