我有一个像下面这样的字符串的RDD
val rdd1: RDD[String] = RDD("a","b","c","d")
我想连接上面RDD的元素并将其转换为单个元素的RDD,如下所示
RDD("a,b,c,d")
这样做的最佳方式是什么?
答案 0 :(得分:4)
使用glom
功能:
val res: RDD[Array[String]] = RDD("a","b","c","d").glom
// > res = RDD(Array("a", "b", "c", "d"))
然后,您可以使用mkString
函数将数组转换为字符串。