我有大约300个功能,我希望通过在weka中使用特征选择技术找到最佳功能子集。有人可以告诉我用什么方法来删除weka中的冗余功能:)
答案 0 :(得分:2)
使用Weka主要有两种类型的特征选择技术:
"包装方法将选择一组特征视为搜索问题,其中准备,评估不同组合并与其他组合进行比较。我们使用预测模型评估特征组合,并根据模型准确度分配分数。
搜索过程可能是有条不紊的,例如最佳优先搜索,它可以是随机的,例如随机爬山算法,或者它可以使用启发式方法,例如前向和后向传递来添加和删除特征。
如果包装器方法是递归特征消除算法的示例。" [来自http://machinelearningmastery.com/an-introduction-to-feature-selection/]
"过滤器功能选择方法应用统计度量来为每个要素指定评分。功能按分数排序,并选择保留或从数据集中删除。这些方法通常是单变量的,可以单独考虑该特征,也可以考虑因变量。
一些滤波方法的例子包括卡方检验,信息增益和相关系数分数。" [来自http://machinelearningmastery.com/an-introduction-to-feature-selection/]