如何使用信息增益作为标准选择前n个要素

时间:2014-03-07 22:36:13

标签: machine-learning weka feature-selection

我有一个training.arff文件,其中每个条目都有2000个功能(属性)。我想使用信息增益标准选择这些属性的前n个。我怎么能用WEKA和命令行呢?我已经在网上查看,似乎这是一个两阶段的过程,因为我必须使用排名作为第二步。有人可以解释一下如何做到这一点吗?

1 个答案:

答案 0 :(得分:2)

这样做的方法是:

java weka.filters.supervised.attribute.AttributeSelection \
-E "weka.attributeSelection.InfoGainAttributeEval" \
-S "weka.attributeSelection.Ranker -N 10" -i training.arff -o training_IG.arff

-E选项是告诉哪个类用作评估者,-S告诉使用什么搜索方法(在这种情况下是排名)。