我的RDD中有以下结构
((String, String) (Int, Int))
我希望将其映射到(String, String, Int, Int)
rdd.map((a, b) => "%s|%s|%s|%s".format(a._1, a._2, b._1, b._2))
我收到以下错误: 错误:参数数量错误;预期= 1
我也试过了,但是出现了编译错误。
rdd.map((a), (b)) => "%s|%s|%s|%s".format(a._1, a._2, b._1, b._2))
rdd.map((tuple1._1, tuple1._2), (tuple2._1, tuple2._2)) => "%s|%s|%s|%s".format(tuple1._1, tuple1._2, tuple2._1, tuple2._2))
很高兴能得到一些帮助。
答案 0 :(得分:3)
不确定为什么要尝试制作字符串,但我认为这就是你想要的
rdd.map{case ((a,b),(c,d)) => (a,b,c,d))}
。 Scala提取器对象规则!!