我有一个training.arff文件,其中每个条目都有2000个功能(属性)。我想使用信息增益标准选择这些属性的前n个。我怎么能用WEKA和命令行呢?我已经在网上查看,似乎这是一个两阶段的过程,因为我必须使用排名作为第二步。有人可以解释一下如何做到这一点吗?
答案 0 :(得分:2)
这样做的方法是:
java weka.filters.supervised.attribute.AttributeSelection \
-E "weka.attributeSelection.InfoGainAttributeEval" \
-S "weka.attributeSelection.Ranker -N 10" -i training.arff -o training_IG.arff
-E选项是告诉哪个类用作评估者,-S告诉使用什么搜索方法(在这种情况下是排名)。