分层抽样在weka中无法正常工作

时间:2014-06-09 08:29:53

标签: weka sample sampling

我有一个数据集,我应用了StringtoWordVector并删除了过滤器,然后使用StratifiedFolds删除了1次

这是我的样本。我的随机种子是0.

enter image description here

但是,当我使用attributeEval过滤器链接stringtowordvector然后删除了一个折叠,我得到了这个样本。

enter image description here

我如何确保两个折叠具有相同的实例?我可以跟随任何一个样本。

我正在尝试比较功能选择的有效性,我无法使用具有不同测试集的功能。

1 个答案:

答案 0 :(得分:0)

我找到了解决方法。首先,我将数据集拆分为折叠并将其保存为train / test arff。然后我在数据集上执行了删除过滤器,这导致了如上所述的分层样本