Weka表示,当两者都是同一个文件时,“训练和测试集不兼容”

时间:2011-12-12 20:14:01

标签: weka

我从weka机器学习工具包中得到了一个非常奇怪的错误:

java weka.classifiers.meta.AdaBoostM1 -t train.arff -d tmp.model -c 22 //generates the model
java weka.classifiers.meta.AdaBoostM1 -l tmp.model -T train.arff -p 22 //have the model predict values in the set it was trained on.

这会产生消息:

java.lang.Exception: training and test set are not compatible
        at weka.classifiers.Evaluation.evaluateModel(Evaluation.java:1035)
        at weka.classifiers.Classifier.runClassifier(Classifier.java:312)
        at weka.classifiers.meta.AdaBoostM1.main(AdaBoostM1.java:779)

但当然,输入文件是一样的......有什么建议吗?

1 个答案:

答案 0 :(得分:2)

当类变量不包含相同数量的类时,有时Weka会抱怨,例如当训练数据由类{a,b,c}组成时,测试数据(稍后加载)只有{a,c}。在那种情况下,Weka只会抛出那个不错的异常:) 也许您在Weka源代码中找到了解决方案,或者通过Weka Explorer加载数据集。后者告诉你数据集加载时的样子......