Weka的主成分分析

时间:2014-06-26 23:39:30

标签: data-mining weka pca

我刚刚在训练集上计算了PCA,Weka用选择和计算它们的方式返回了新属性。 现在,我想使用这些数据构建模型,然后在测试集上使用该模型。

您知道是否有办法根据新属性类型自动修改测试集?

2 个答案:

答案 0 :(得分:6)

您是否需要主要组件进行分析或仅仅是为了分类器?如果不只是使用Meta-> FilteredClassifier分类器。将过滤器设置为PrincipalComponents,并将分类器设置为您要使用的分类器。在未经转换的训练集上训练它,您就可以将它转换为未转换的测试集。

如果您确实需要修改过的测试集,我建议您使用知识流工具制作如下内容:enter image description here

答案 1 :(得分:2)

要从命令行执行此操作,可以在以下位置找到该文档:https://weka.wikispaces.com/Batch+filtering

以下是一个例子:

java weka.filters.supervised.attribute.AttributeSelection \
  -b -i train.arff -o train_pca.arff \
  -r test.arff -s test_pca_output.arff \
  -E "weka.attributeSelection.PrincipalComponents -R 0.95 -A 5" \
  -S "weka.attributeSelection.Ranker -T -1.7976931348623157E308 -N -1"