WEKA中的监督重采样和非监督重采样有什么区别?

时间:2020-07-19 20:36:20

标签: java machine-learning classification weka resampling

我想知道weka.filters.supervised.instance.Resampleweka.filters.unsupervised.instance.Resample有什么区别? 在什么情况下我们应该使用每个?

1 个答案:

答案 0 :(得分:1)

有监督和无监督重采样的文档是相同的除了 监督重采样的文档中有另外一句话:

可以使过滤器保持子样本中的类分布, 或将类别分布偏向均匀分布。

监督重采样还具有额外的参数:

-B <num>
Bias factor towards uniform class distribution.
0 = distribution in input data  
1 = uniform distribution.
(default 0)

因此,监督重采样仅在存在类变量时适用。当完全偏向输入分布(B = 0)时,每个子样本将复制整个数据集的类分布。 B = 1等同于无监督重采样,在这种情况下,不考虑类别,就从整个总体中均匀地提取点数。