如何使用scala从元组元组中形成元组?

时间:2014-11-05 06:52:02

标签: scala collections apache-spark

我的输入是,它是RDD [((Int,(String,String)),Int)]

的形式
((0,(sunny,no)),3)
((0,(sunny,yes)),2)
((0,(overcast,yes)),4)
((0,(rainy,yes)),3)
((0,(rainy,no)),2)

我希望输出为,

(3,2)
(4)
(3,2)

1 个答案:

答案 0 :(得分:2)

您可以执行以下操作:

val data: RDD[((Int,(String,String)),Int)] = ???

val treated = data.groupBy(_._1._2._1).map(_._2.map(_._2))

这将为您提供所需格式的RDD[(String, Iterable[Int])]