我是Apache Spark的新手。正如标题所说,我有一个JavaPairRdd<String,String>
,我希望生成一个JavaRdd<String>
,其中包含密钥和JavaPairRdd
的值的串联。这可能吗?
示例:
("1,Nick", "mail@sth.com,53")
("2,John", "mail@sth.com,53")
结果(JavaRdd<String>
with):
"1,Nick,mail@sth.com,53"
"2,John,mail@sth.com,53"
答案 0 :(得分:1)
只需使用map
:
pairRDD.map((key, value) => key + value)
那是使用scala,但你应该得到要点。