我正在尝试使用逻辑回归模型对一些EEG数据进行分类(这似乎给出了我数据的最佳分类)。我的数据来自多通道EEG设置,所以本质上我有一个63 x 116 x 50的矩阵(即通道x时间点x试验次数(有两种试验类型为50),我已将其重新设计为长矢量,每个试验一个。
我想要做的是在分类之后看看哪些特征在分类试验中最有用。我怎么能这样做,是否有可能测试这些功能的重要性?例如说分类主要是由N特征驱动,这些是特征x到z。例如,我可以说时间点90-95的通道10对于分类来说是重要的或重要的。
这是可能的,还是我问错了问题?
非常感谢任何评论或论文参考。
答案 0 :(得分:36)
Scikit-learn包含了很多功能排名方法,其中包括:
(详见http://scikit-learn.org/stable/modules/feature_selection.html)
其中,我绝对建议给予随机Logistic回归一次。根据我的经验,它始终优于其他方法并且非常稳定。 论文:http://arxiv.org/pdf/0809.2932v2.pdf
修改强> 我已经写了一系列关于不同特征选择方法及其优缺点的博客文章,这可能对回答这个问题更有用: