我有一个val ds: Dataset[Double]
(在Spark 2.0.0中),但是可以传递给apply
或col
以从此转换的双值列的名称是什么1列Dataset
到Column
。
答案 0 :(得分:7)
列名是"值"与ds.col("value")
中一样。 Dataset.schema
包含以下信息:ds.schema.fields.foreach(x => println(x))
答案 1 :(得分:7)
您还可以使用DataFrame
的方法columns
,它将所有列作为字符串数组返回。
case class Person(age: Int, height: Int, weight: Int){
def sum = age + height + weight
}
val df = sc.parallelize(List(Person(1,2,3), Person(4,5,6))).toDF("age", "height", "weight")
df.columns
//res0: Array[String] = Array(age, height, weight)