我正在使用以下代码在Spark中使用Xgboost生成预测。
OPTIONS
import ml.dmlc.xgboost4j.scala.spark.{XGBoostClassificationModel, XGBoostClassifier}
import org.apache.spark.ml.linalg.DenseVector
val xgbClassificationModel = xgbClassifier.fit(train)
val result = xgbClassificationModel.transform(test)
是一个DataFrame,并且大多数列都包含DenseVector。
我正在尝试访问存储在这些DenseVectors中的数值。
例如。我想从DataFrame中提取一个DenseVector,并将其存储为result
。
以下代码有效,但是我有一种更简单的方法吗?
Array[Double]
来自R,我发现在Spark中访问存储在DataFrames中的值的方式非常麻烦,想知道我是否缺少某些东西。