Spark:从DenseVector列中提取单个值

时间:2019-01-20 15:32:04

标签: apache-spark

我正在使用以下代码在Spark中使用Xgboost生成预测。

OPTIONS

import ml.dmlc.xgboost4j.scala.spark.{XGBoostClassificationModel, XGBoostClassifier} import org.apache.spark.ml.linalg.DenseVector val xgbClassificationModel = xgbClassifier.fit(train) val result = xgbClassificationModel.transform(test) 是一个DataFrame,并且大多数列都包含DenseVector。

我正在尝试访问存储在这些DenseVectors中的数值。 例如。我想从DataFrame中提取一个DenseVector,并将其存储为result

以下代码有效,但是我有一种更简单的方法吗?

Array[Double]

来自R,我发现在Spark中访问存储在DataFrames中的值的方式非常麻烦,想知道我是否缺少某些东西。

0 个答案:

没有答案