将要素选择输出映射到列名称(ChiSqSelector)

时间:2016-05-27 10:01:40

标签: scala apache-spark apache-spark-mllib spark-dataframe

我正在尝试为数据集选择最具预测性的功能......

label   features
class1  [2, 5.7, 3]
class1  [6, 3.2, 1]
...

...在Spark上使用ChiSqSelector

val selector = new ChiSqSelector()
  .setNumTopFeatures(10)
  .setFeaturesCol("features")
  .setLabelCol("label")
  .setOutputCol("selectedFeatures")

val result = selector.fit(predictions).transform(predictions)
display(result)

当我这样做时,输出只是排名列

selectedFeatures
[5.7, 3, 2]
[3.2, 1, 6]
...

但是,我想改为排名列名...实现这一目标的最佳方法是什么?

0 个答案:

没有答案