当我对m类进行n次交叉验证时,在每个折叠中,列车和测试装置是否平衡?通过平衡,我的意思是询问列车和测试集中是否有(几乎)相同的样本集。
答案 0 :(得分:5)
如果我理解这部分:
我的意思是询问列车和测试集中每个班级是否有(几乎)相同的样本集。
...我认为你指的是分层交叉验证:每个折叠的类比例与整个数据集的类比例相同。
是的,Weka当然可以,但您可能需要查阅文档。这些帮助可能吗?
http://weka.wikispaces.com/Primer
http://weka.wikispaces.com/Generating+cross-validation+folds+(Java+approach)
http://weka.sourceforge.net/doc/weka/filters/supervised/instance/StratifiedRemoveFolds.html