我正在使用weka并尝试测试我的文件但总是有一个弹出窗口显示“Train and Test set not compatible”。我正在使用csv文件。所有属性在两个文件中都相同。在30个属性中,我将它们分为两部分,前20个属性作为训练集,其余10作为测试集。请帮帮我。
答案 0 :(得分:3)
您的属性及其顺序在两个文件中必须相同。请参阅以下Weka Wiki post和堆栈溢出question 1和question 2。即使很小的差异也可能导致此错误。
根据你的说法,他们的订单可能相同,但根据weka他们不一样。将它们转换为arff格式,然后重试。你会看到他们的arff标题不一样。见下面的例子。
CSV file1
Feature A
true
false
CSV file2
Feature A
false
true
将这些CSV文件表示为arff标头不是SAME。由于它们在文件中首次发生更改,因此它们在arff标头中的顺序也会发生变化。