如何使用weka删除冗余功能

时间:2015-11-25 10:40:03

标签: machine-learning classification weka feature-selection

我有大约300个功能,我希望通过在weka中使用特征选择技术找到最佳功能子集。有人可以告诉我用什么方法来删除weka中的冗余功能:)

1 个答案:

答案 0 :(得分:2)

使用Weka主要有两种类型的特征选择技术:

  • 使用包装器方法选择功能:

"包装方法将选择一组特征视为搜索问题,其中准备,评估不同组合并与其他组合进行比较。我们使用预测模型评估特征组合,并根据模型准确度分配分数。

搜索过程可能是有条不紊的,例如最佳优先搜索,它可以是随机的,例如随机爬山算法,或者它可以使用启发式方法,例如前向和后向传递来添加和删除特征。

如果包装器方法是递归特征消除算法的示例。" [来自http://machinelearningmastery.com/an-introduction-to-feature-selection/]

  • 使用过滤方法选择特征:

"过滤器功能选择方法应用统计度量来为每个要素指定评分。功能按分数排序,并选择保留或从数据集中删除。这些方法通常是单变量的,可以单独考虑该特征,也可以考虑因变量。

一些滤波方法的例子包括卡方检验,信息增益和相关系数分数。" [来自http://machinelearningmastery.com/an-introduction-to-feature-selection/]

如果您使用的是Weka GUI,那么您可以查看我的两个视频广告herehere