在Spark / Scala中组合字符串

时间:2014-09-25 19:38:44

标签: string scala apache-spark

我有必须将String与RDD out(String)

组合在一起

字符串1

date=

字符串2(字符串的RDD)

20140101
20140102
20140103
....

输出为

date=20140101, date=20140102, date=20140103,.....

请帮我实现这个结果

2 个答案:

答案 0 :(得分:2)

在Spark中你会这样做:

// Some sample data in an RDD
val data = List("20140101", "20140102", "20140103")
val rdd = sc.parallelize(data)

val concatenated = rdd.map(elem => s"date=$elem").reduce(_ + ", " + _)

请注意reduce是一项操作。因此,reduce的结果需要适合驱动程序的内存。

答案 1 :(得分:0)

string2.map(d => s"$string1=$d").mkString(",")