我刚刚在训练集上计算了PCA,Weka用选择和计算它们的方式返回了新属性。 现在,我想使用这些数据构建模型,然后在测试集上使用该模型。
您知道是否有办法根据新属性类型自动修改测试集?
答案 0 :(得分:6)
您是否需要主要组件进行分析或仅仅是为了分类器?如果不只是使用Meta-> FilteredClassifier分类器。将过滤器设置为PrincipalComponents,并将分类器设置为您要使用的分类器。在未经转换的训练集上训练它,您就可以将它转换为未转换的测试集。
如果您确实需要修改过的测试集,我建议您使用知识流工具制作如下内容:
答案 1 :(得分:2)
要从命令行执行此操作,可以在以下位置找到该文档:https://weka.wikispaces.com/Batch+filtering
以下是一个例子:
java weka.filters.supervised.attribute.AttributeSelection \
-b -i train.arff -o train_pca.arff \
-r test.arff -s test_pca_output.arff \
-E "weka.attributeSelection.PrincipalComponents -R 0.95 -A 5" \
-S "weka.attributeSelection.Ranker -T -1.7976931348623157E308 -N -1"