通过连接键和值将JavaPairRdd转换为JavaRdd

时间:2016-04-26 04:40:39

标签: java apache-spark concatenation rdd

我是Apache Spark的新手。正如标题所说,我有一个JavaPairRdd<String,String>,我希望生成一个JavaRdd<String>,其中包含密钥和JavaPairRdd的值的串联。这可能吗?

示例:

("1,Nick", "mail@sth.com,53")
("2,John", "mail@sth.com,53")

结果(JavaRdd<String> with):

"1,Nick,mail@sth.com,53"
"2,John,mail@sth.com,53"

1 个答案:

答案 0 :(得分:1)

只需使用map

pairRDD.map((key, value) => key + value)

那是使用scala,但你应该得到要点。