测试和训练集不兼容

时间:2014-11-20 06:47:15

标签: weka

我正在使用weka并尝试测试我的文件但总是有一个弹出窗口显示“Train and Test set not compatible”。我正在使用csv文件。所有属性在两个文件中都相同。在30个属性中,我将它们分为两部分,前20个属性作为训练集,其余10作为测试集。请帮帮我。

1 个答案:

答案 0 :(得分:3)

您的属性及其顺序在两个文件中必须相同。请参阅以下Weka Wiki post和堆栈溢出question 1question 2。即使很小的差异也可能导致此错误。

根据你的说法,他们的订单可能相同,但根据weka他们不一样。将它们转换为arff格式,然后重试。你会看到他们的arff标题不一样。见下面的例子。

CSV file1

Feature A
true
false

CSV file2

Feature A
false
true

将这些CSV文件表示为arff标头不是SAME。由于它们在文件中首次发生更改,因此它们在arff标头中的顺序也会发生变化。