SMOTE在随机林中不能用于保持样本

时间:2015-05-13 18:11:50

标签: random random-forest

我使用SMOTE进行过采样,我的Traning样本中的事件率约为4%。结果在Training示例中得到了很好的验证,但在Hold Out Sample中没有很好地验证。我为Perc.Over和Perc.Under尝试了不同的组合。

  1. 如何选择Perc.Over和Perc的编号。下
  2. 我如何确保它能够很好地验证,以及

1 个答案:

答案 0 :(得分:0)

你应该设置perc.under以捕获所有多数类样本和perc.over以将少数类样本提升至至少10%以消除类不平衡问题。 如果问题仍然存在,那么它可能表明存在很多“嘈杂”的问题。少数民族班的样本。试一试,看看它是否有效!