Question

我目前有一个带有数组的RDD，该数组存储键值对，其中键是数组的2D索引，值是该点的数字。例如[（（0,0），1），（（0,1），2），（（1,0），3），（（1,1），4）] 我想将每个键的值与周围值相加。关于我之前的例子，我想将1,2,3加起来并将其放在（0,0）键值位置。我该怎么做？

Answer 1

我建议你做以下事情：

在您的RDD上使用flatMap，如下所示：

MyRDD = MyRDD.flatMap(lambda (pos, v): [(p, v) for p in surrounding_pairs(pos)])

这将映射您的RDD [((0,0),1),((0,1),2),((1,0),3),((1,1),4)]到

[((0,0),1),((0,1),1),((1,0),1),
 ((0,1),2),((0,0),2),((1,1),2),
 ((1,0),3),((0,0),3),((1,1),3),
 ((1,1),4),((1,0),4),((0,1),4)]

这样，每个位置的值将被“复制”到邻居位置。

最后，只需使用reduceByKey在每个位置添加相应的值：
```
from operator import add
MyRDD = MyRDD.reduceByKey(add)
```

我希望这是有道理的。