标签: r machine-learning random-forest
我有一个高度不平衡的数据,并希望对少数群体进行上调以提高准确性(少数群体是感兴趣的对象)。
我尝试在“randomForest”函数中使用“sampsize”选项 - 但它只允许进行下采样。我在某个地方读过,可以使用“classwt”选项 - 但我不知道如何使用它。
任何人都可以通过对少数类进行上采样(使用“randomForest”库或其他此类库)来建议在R中运行Random Forest的方法。
感谢。
答案 0 :(得分:0)
最简单的方法是只复制少数类的数据,但之后就会丢失OOB估计值。
您想直接执行的操作似乎没有实现,另请参阅this question。