从Python中的一对RDD获取值

时间:2017-07-07 06:38:16

标签: pyspark rdd

如何从形式为[('key', (value1, value2))]的RDD对中获取value1和value2。

1 个答案:

答案 0 :(得分:0)

您可以使用mapValues函数来解决此问题。考虑产品RDD具有以下结构:

[('someKey', (10, 20))]

然后,为了找到一个新的RDD(resultRDD),它包含产品RDD中值的乘积,我们使用:

resultRDD = productRDD.mapValues(lambda value: value[0] * (value[1]))

resultRDD将包含以下数据:

[('someKey', 200)]