Scikit-learn中的特征选择算法

时间:2016-01-30 12:02:46

标签: python machine-learning scikit-learn

我正在使用Scikit-learn进行二进制分类任务..我正在尝试使用以下方法之一执行特征选择:基于相关的特征选择(CFS)子集评估器和最佳优先搜索算法...我无法和#39;在功能选择模块中找到它们中的任何一个!他们在Scikit中列出了另一个名字,还是有任何等价物?因为我想重复一个实验,他们已经使用这些算法来减少数据。

2 个答案:

答案 0 :(得分:1)

sklearn.feature_selection中: SelectKBestSelectPercentile评估子集性能,RFE执行递归功能消除。

关于最佳优先搜索,请参阅Smart Feature Selection with scikit-learn and BigML’s API

我非常怀疑你能否根据所使用的算法名称FWIW准确地再现一些实验结果。

答案 1 :(得分:0)

不确定Scikit-Learn是否具有FCBF(基于快速相关的过滤器)。但是,您可以使用ASU(亚利桑那州立大学)的功能选择包中的实现(MATLAB)。 下载链接:

  

http://featureselection.asu.edu/algorithms/fs_sup_fcbf.zip

相应文件:

  

http://www.cs.binghamton.edu/~lyu/publications/Yu-Liu03ICML.pdf