Spark / Scala - 重命名List生成的列

时间:2017-09-04 11:55:08

标签: scala apache-spark apache-spark-sql

如何在Spark / Scala中将_1_2重命名为有意义的列名?

root
   |-- aaa: string (nullable = true)
   |-- bbb: array (nullable = true)
   |    |-- element: struct (containsNull = true)
   |    |    |-- _1: string (nullable = true)
   |    |    |-- _2: long (nullable = false)

1 个答案:

答案 0 :(得分:0)

创建案例类并将元组转换为案例类。这样你就可以命名为元组。

case class person(name:String,age:Int)
 val personRdd=rdd.map(_.split(<delimeter>)).map(x => person(x._1,x._2))

现在您可以将personRdd元组值作为

访问
personRdd.map(p => (p.name+":"+p.age))