Spark - 将元组转换为Tab分隔字符串

时间:2015-07-24 19:57:35

标签: scala apache-spark

我想创建一个函数,它接受元组的RDD并将每个元组转换为制表符分隔的字符串。我希望该函数能够处理任何大小的元组。

如果我已经创建了这个RDD,我可以使用以下方法获得所需的输出:

  <artifactId>spring-beans</artifactId>
  <artifactId>spring-webmvc</artifactId>
  <artifactId>spring-context</artifactId>
  <artifactId>spring-jdbc</artifactId>
  <artifactId>spring-core</artifactId>
  <artifactId>spring-web</artifactId>
  <artifactId>spring-boot</artifactId>

如何将这段代码转换为一个带有元组RDD的函数,或者是否有一个好的库已经这样做了?

1 个答案:

答案 0 :(得分:3)

这样的事情应该有效:

def toTab[T <: Product](rdd:RDD[T]) = rdd.map(_.productIterator.mkString("\t"))