将两个rdds的值除以spark(python)

时间:2016-11-24 14:30:19

标签: python apache-spark rdd division bigdata

我在spark中有这两个键值RDD:

rdd1 = [(u'Key1', 4), (u'Key2', 6), (u'Key3', 10)]
rdd2 = [(u'Key1', 4), (u'Key2', 3), (u'Key3', 2)]

我查看spark函数来得到值的除法:(rdd3 =(rdd1 / rdd2))

在这种情况下:

rdd3 = [(u'Key1', 1), (u'Key2', 2), (u'Key3', 5)]

1 个答案:

答案 0 :(得分:4)

您可以joinmapValues

rdd1.join(rdd2).mapValues(lambda x: x[0] / x[1])