sklearn单变量特征选择

时间:2014-02-04 03:59:33

标签: python machine-learning scikit-learn

我正在尝试使用sklearn单变量功能选择来过滤掉不相关的功能:

ufs = feature_selection.SelectPercentile(feature_selection.f_classif, percentile = 60)
X_default_cvtrain = ufs.fit_transform( X_cvtrain, Y_cvtrain )

但是,我收到了这个警告:

UserWarning: Duplicate scores. Result may depend on feature ordering.
             There are probably duplicate features, or you used a classification score for a regression task.
warn("Duplicate scores. Result may depend on feature ordering."

这是什么意思?这是怎么回事?

感谢。

1 个答案:

答案 0 :(得分:5)

这意味着有重复的分数,因此所选的功能取决于功能排序。 可能的原因是您有重复的功能。