我的输入是,它是RDD [((Int,(String,String)),Int)]
的形式((0,(sunny,no)),3)
((0,(sunny,yes)),2)
((0,(overcast,yes)),4)
((0,(rainy,yes)),3)
((0,(rainy,no)),2)
我希望输出为,
(3,2)
(4)
(3,2)
答案 0 :(得分:2)
您可以执行以下操作:
val data: RDD[((Int,(String,String)),Int)] = ???
val treated = data.groupBy(_._1._2._1).map(_._2.map(_._2))
这将为您提供所需格式的RDD[(String, Iterable[Int])]
。