如何从DataFrame获取Array [Seq [String]]?

时间:2016-05-19 15:54:17

标签: scala dataframe

如何将DataFrame cc传递到Array[Seq[String]]

val factors = $(ccCols).split(",")
val cc = dataset.select(factors.head, factors.tail: _*)

我试过这种方式,但它给了我Array[Row]

cc.rdd.collect()

1 个答案:

答案 0 :(得分:3)

您需要使用toSeq对象的Row函数:

val a = sc.parallelize(Seq((1,2),(3,4))).toDF("a", "b")
a.show
/*
Output:
+-+-+
|a|b|
+-+-+
|1|2|
|3|4|
+-+-+
*/

a.collect.map(_.toSeq)
// Output: Array(WrappedArray(1, 2), WrappedArray(3, 4))