我有一个具有2类的数据集,但是第一个有94091行,第二个有16937行。
我想使用smote
包,并给我返回60%的类1和其他40%的结果。
data.train_smote <- SMOTE(situa_ence ~ ., data.train, perc.over = 100, k=10)
答案 0 :(得分:0)
您需要找到满足以下条件的perc.over
(1+perc.over) *16937 / ((1+perc.over)*16937 + 94091) = 0.4
perc.over = 3.70357非常接近。