我使用WEKA进行文本分类,我已经训练了数据集,并且我应用了StringToWOrdVector和NumericToNominal过滤器,并且测试数据集并在其上应用了相同的过滤器。 当我尝试将我的模型应用于测试数据时,它给了我以下错误 火车和测试装置不兼容 我搜索了一个解决方案,错误的发生是因为两组之间属性的数量不同,并且它总是不同的,因为两组中的文本是不同的
我怎么能解决这个错误?
答案 0 :(得分:0)
您可以做的最好的事情是将您的训练和测试集合并到一个文件中,然后一次性将过滤器应用到它,然后再将它们拆分并将组合文件中的@attribute
值复制到培训和测试文件。这样,两个文件的属性都是一致的。