我正在尝试为数据集选择最具预测性的功能......
label features
class1 [2, 5.7, 3]
class1 [6, 3.2, 1]
...
...在Spark上使用ChiSqSelector:
val selector = new ChiSqSelector()
.setNumTopFeatures(10)
.setFeaturesCol("features")
.setLabelCol("label")
.setOutputCol("selectedFeatures")
val result = selector.fit(predictions).transform(predictions)
display(result)
当我这样做时,输出只是排名列值:
selectedFeatures
[5.7, 3, 2]
[3.2, 1, 6]
...
但是,我想改为排名列名...实现这一目标的最佳方法是什么?