我有一个数据集,我应用了StringtoWordVector并删除了过滤器,然后使用StratifiedFolds删除了1次
这是我的样本。我的随机种子是0.
但是,当我使用attributeEval过滤器链接stringtowordvector然后删除了一个折叠,我得到了这个样本。
我如何确保两个折叠具有相同的实例?我可以跟随任何一个样本。
我正在尝试比较功能选择的有效性,我无法使用具有不同测试集的功能。
答案 0 :(得分:0)
我找到了解决方法。首先,我将数据集拆分为折叠并将其保存为train / test arff。然后我在数据集上执行了删除过滤器,这导致了如上所述的分层样本