ROSE如何创建新的合成数据样本?

时间:2019-01-08 13:44:45

标签: r

我正在尝试用ROSE软件包中的ROSE平衡我的数据集。 ROSE使用平滑的引导程序方法,并且对应于内核密度估计。我了解内核密度估计,但是,我不了解什么是平滑的引导程序以及如何使用此方法创建新数据(分类)。

我已经尝试过SMOTE功能,并且对少数派进行了过度采样。

library(ROSE)
rose_train <- ROSE(case~ ., train)

table(rose_train$`data`$case)


tree <- rpart(rose_train$`data`$case~ ., rose_train$`data`, 
            method    = "class", 
            minsplit  = 1, minbucket=1, maxdepth=3, 
            parms     = list(split = "gini"), 
            cp        = -1)
pred <- predict(tree,test, type ="class")

我只想知道平滑的引导程序是什么以及它对ROSE的工作原理。

0 个答案:

没有答案