我正在尝试用ROSE软件包中的ROSE平衡我的数据集。 ROSE使用平滑的引导程序方法,并且对应于内核密度估计。我了解内核密度估计,但是,我不了解什么是平滑的引导程序以及如何使用此方法创建新数据(分类)。
我已经尝试过SMOTE功能,并且对少数派进行了过度采样。
library(ROSE)
rose_train <- ROSE(case~ ., train)
table(rose_train$`data`$case)
tree <- rpart(rose_train$`data`$case~ ., rose_train$`data`,
method = "class",
minsplit = 1, minbucket=1, maxdepth=3,
parms = list(split = "gini"),
cp = -1)
pred <- predict(tree,test, type ="class")
我只想知道平滑的引导程序是什么以及它对ROSE的工作原理。