我有想要测试分类器的数据。 此数据具有许多属性,而目标类为二进制true / false。 此外,我知道数据来自32个来源,称为1-32。 此信息位于arff文件中。
所以我有一个arff文件:
@attribute <MANY ATTRIBUTES>
@attribute <MANY ATTRIBUTES>
@attribute class {True,False}
@attribute source {1,2,3,4,5,6,7,8,9,...,30,31,32}
在分类器下的weka资源管理器中,我可以选择交叉验证4折。 但是,然后weka会将这些实例随机排序到4个bin中。我想要的是weka将使用24个源作为火车,8个作为测试。 因此,每个来源都完全处于测试或培训状态,但两者都没有。
使用板载方法是否可行?
答案 0 :(得分:0)
如果您不想使用4折交叉验证,但只想使用24作为列车而8作为测试,则可以将文件拆分为2(24合1,其中8)。将24文件加载到Preprocess中。在“分类器”选项卡中,单击“提供的测试集”旁边的单选按钮,而不是交叉验证,然后为其指定8个文件的文件名。