标签: machine-learning classification weka
“Weka:训练和测试集不兼容”可以使用批量过滤来解决,但在训练模型时我没有test.arff。我的问题是在命令“stringToWord vector”(在CLI上)引起的。
所以我的问题是,Caret package(R)或Scikit learn(Python)可以提供任何替代方案。 注意: 1.“stringToWord vector”提供的功能是必须的。 2.我不想在测试时重新训练我的模型,因为这需要很多时间。
答案 0 :(得分:0)
鉴于您提到的要求,您可以在培训和测试期间使用Weka的Filtered Classifier选项。我没有重复我录制的视频广告here和here。
但基本思路不是将StringToWord向量用作直接过滤器,而是将其用作FilteredClassifier选项中的过滤选项。您生成的模型只需一次。然后,您可以直接在未标记数据上应用模型,而无需重新训练它们,也无需在未标记数据上再次应用StringToWord向量。 FilteredClassifier将为您解决这些问题。