R - randomForest中的上采样

时间:2013-02-15 04:57:28

标签: r machine-learning random-forest

我有一个高度不平衡的数据,并希望对少数群体进行上调以提高准确性(少数群体是感兴趣的对象)。

我尝试在“randomForest”函数中使用“sampsize”选项 - 但它只允许进行下采样。我在某个地方读过,可以使用“classwt”选项 - 但我不知道如何使用它。

任何人都可以通过对少数类进行上采样(使用“randomForest”库或其他此类库)来建议在R中运行Random Forest的方法。

感谢。

1 个答案:

答案 0 :(得分:0)

最简单的方法是只复制少数类的数据,但之后就会丢失OOB估计值。

您想直接执行的操作似乎没有实现,另请参阅this question