如何将DataFrame
cc
传递到Array[Seq[String]]
?
val factors = $(ccCols).split(",")
val cc = dataset.select(factors.head, factors.tail: _*)
我试过这种方式,但它给了我Array[Row]
:
cc.rdd.collect()
答案 0 :(得分:3)
您需要使用toSeq
对象的Row
函数:
val a = sc.parallelize(Seq((1,2),(3,4))).toDF("a", "b")
a.show
/*
Output:
+-+-+
|a|b|
+-+-+
|1|2|
|3|4|
+-+-+
*/
a.collect.map(_.toSeq)
// Output: Array(WrappedArray(1, 2), WrappedArray(3, 4))