我有一个一次接受一个文件的算法。我需要它来学习训练集中的规则并将其应用于测试集。因此,如果我在同一文件中的训练集之后立即包含我的测试集,我会正确地执行此操作吗?
目前我已将其作为
@data ....训练集
@data ....测试集
答案 0 :(得分:0)
我假设您使用Weka,在这种情况下,这不是“正确”的方式。首先创建一个用于训练数据的ARFF文件。然后使用相同的数据结构(您在ARFF文件中定义的结构通知结构化方式),创建一个测试ARFF文件。
在培训部分,Weka会要求您提供培训文件,然后您将有另一个选项来提供测试数据,基本上提供给测试文件。这就是惯例。您可以将所有数据放在一个文件中,也可以将其拆分,但是您可能需要使用Weka源代码,而且可能无法通过Weka的浏览器来完成。