在插入符号:: train中,有许多预处理选项可以通过“预处理”来传递。论点。这使得生活变得非常简单,因为在调用“预测”时,测试数据会以与训练数据相同的方式自动进行预处理。 是否可以使用' findCorrelation'和' nearZeroVar'以某种方式?
我从文档中清楚地了解为什么以下代码不起作用,但我希望这澄清了我的问题。理想情况下,我可以做到以下几点。
library("caret")
set.seed (1234)
data (iris)
# split test vs training
train.index <- createDataPartition (y = iris[,5], p = 0.80, list = F)
train <- iris [ train.index, ]
test <- iris [-train.index, ]
# train the model after imputing the missing data
fit <- train (Species ~ .,
train,
preProcess = c("findCorrelation", "nearZeroVar"),
method = "rpart" )
predict (fit, test)
答案 0 :(得分:1)
现在,你与preProcess
将要做的事情联系在一起。
然而,下一个版本(我希望在今年年初左右)将允许您更轻松地编写自定义模型和预处理。例如,您可能希望对数据进行下采样等。
如果我们有可用的测试版,您是否愿意测试该版本。
最高