weka - 训练和测试数据具有不同数量的属性，导致错误“训练和测试集不兼容”

训练和测试数据具有不同数量的属性，导致错误“训练和测试集不兼容”

时间：2015-10-26 02:17:58

标签： weka

我使用WEKA进行文本分类，我已经训练了数据集，并且我应用了StringToWOrdVector和NumericToNominal过滤器，并且测试数据集并在其上应用了相同的过滤器。当我尝试将我的模型应用于测试数据时，它给了我以下错误火车和测试装置不兼容我搜索了一个解决方案，错误的发生是因为两组之间属性的数量不同，并且它总是不同的，因为两组中的文本是不同的

我怎么能解决这个错误？

1 个答案:

答案 0 :(得分：0)

您可以做的最好的事情是将您的训练和测试集合并到一个文件中，然后一次性将过滤器应用到它，然后再将它们拆分并将组合文件中的@attribute值复制到培训和测试文件。这样，两个文件的属性都是一致的。

Weka：火车和测试装置不兼容
在对布尔数据进行分类时，WEKA Train和测试集不兼容
火车和测试装置在weka中不兼容错误？
训练和测试集不兼容：比较2个csv文件
测试和训练集不兼容
训练和测试数据具有不同数量的属性，导致错误“训练和测试集不兼容”
训练和测试集在weka中不兼容错误
奇怪的火车和测试集在weka中不兼容错误
错误评估分类器训练和测试数据集不兼容
训练和测试集不兼容

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？