我有34个功能训练集,在功能选择之后只考虑了10个最佳功能。我保存了模型并尝试使用训练模型重新评估测试集。有一个弹出窗口说测试集和训练集不匹配,有一件事是测试集包含所有34个参数,我甚至尝试删除所选的其他所有参数,仍然出现一些错误,我是不满意结果,所以请帮助我这方面
答案 0 :(得分:0)
特征选择过程也必须应用于测试集。您可以使用命令行界面中的批处理选项(-b
)来执行此操作。只需输入以下命令即可获得选项:
java weka.filters.supervised.attribute.AttributeSelection -b -h
以下是一个示例,adapted from this post。
java weka.filters.supervised.attribute.AttributeSelection -E \\
weka.attributeSelection.InfoGainAttributeEval \\
-S "weka.attributeSelection.Ranker -T 0.0" \\
-b -i training.arff -o training.ig0.arff -r test.arff -s test.ig0.arff