我需要在Weka中使用Resample,以通过过度采样,欠采样,SMOTE和ROSE平衡数据集。我知道Weka中有一个SMOTE过滤器,因此我能够弄清楚该方法。但是,当使用Resample进行过采样和欠采样时(我还没有了解ROSE),我对将每个选项设置为什么感到困惑。有S(随机种子数),Z(输出数据集的大小,以输入数据集的百分比表示),偏差(偏向于均匀类分布的偏差因子),无替换(布尔值)和V(反转选择-布尔值)。
我知道过采样和欠采样会使用偏差,但是我不知道如何设置偏差以及是否需要设置任何其他选项。
我一直在互联网上寻求帮助,但是没有运气,所以我想在这里问。
谢谢。