Weka中不相容的列车和测试数据的问题

时间:2016-05-24 21:32:31

标签: weka

我正在尝试在Weka中的数据集上运行分类器(J48)。我尝试提供测试数据,虽然训练和测试集中的属性和相应数据类型都不相同,但我经常收到错误"问题评估分类器:测试和训练集不兼容" 。两个数据集都没有任何共同记录。 此错误与我选择的分类技术无关。一旦我尝试使用测试数据,就会发生这种情况。 我该如何解决这个问题?我已多次检查数据类型和属性名称。它们是相同的

1 个答案:

答案 0 :(得分:0)

事实证明数据集实际上是不兼容的:)

如果仔细检查ARFF文件的标题,您会注意到第236行和第237行不匹配。在测试数据集中,您需要为属性CPR添加N / A类。此外,Weka使用数字索引,并且分类值的顺序很重要。您应该交换第236行中的值。

is_numeric()

我知道你有CSV文件,并从那些文件中获取ARFF。自动过程可能不会考虑这些因素。通常,您需要使用包含培训和测试用例的文件来生成标题,然后将其拆分或将标题复制粘贴到从单个CSV文件生成的文件中。