Scala映射函数优于RDD

时间:2014-07-04 01:05:29

标签: scala apache-spark

我的RDD中有以下结构

((String, String) (Int, Int))我希望将其映射到(String, String, Int, Int)

rdd.map((a, b) => "%s|%s|%s|%s".format(a._1, a._2, b._1, b._2))

我收到以下错误:  错误:参数数量错误;预期= 1

我也试过了,但是出现了编译错误。

rdd.map((a), (b)) => "%s|%s|%s|%s".format(a._1, a._2, b._1, b._2))

rdd.map((tuple1._1, tuple1._2), (tuple2._1, tuple2._2)) => "%s|%s|%s|%s".format(tuple1._1, tuple1._2, tuple2._1, tuple2._2))

很高兴能得到一些帮助。

1 个答案:

答案 0 :(得分:3)

不确定为什么要尝试制作字符串,但我认为这就是你想要的 rdd.map{case ((a,b),(c,d)) => (a,b,c,d))}。 Scala提取器对象规则!!