如何使用sklearn LDA coef_进行特征选择

时间:2016-10-07 15:12:08

标签: scikit-learn selection

我有一组功能Train = [a1,a2,...,aN]和Train_label = [y1,y2,...,yN]。我有3节课。我申请了LDA

clf = LDA(store_covariance = True)
clf.fit(Train, Train_label) 

并试图通过

来了解这些功能的重要性
clf.coef_. 

结果是3XN阵列。返回值的范围从负800左右到正800左右。该图显示了一个classclf.coef_ [1,:]的权重

weights of one classclf.coef_[1,:] 负值意味着什么?

我选择每个类的特征,使用前3个最大的coef_值进行分类(交叉验证和训练和测试)。

selected_features = [a27, a22, a5, a23, a10, a42]  

其中,a27,a22,a5被选为3个特征,第一类具有最大coef,第二类具有a27,a23,a10,第三类具有a27,a10,a42。

但分类准确度下降了很多!结果比我之前选择的一些功能更糟糕。我尝试了6个具有最大coef_值的选定特征,结果也很糟糕。

任何人都可以告诉我哪里出错了,并向我解释使用LDA进行特征选择的正确方法是什么?

0 个答案:

没有答案