Question

在插入符号:: train中，有许多预处理选项可以通过“预处理”来传递。论点。这使得生活变得非常简单，因为在调用“预测”时，测试数据会以与训练数据相同的方式自动进行预处理。 是否可以使用＆＃39; findCorrelation＆＃39;和＆＃39; nearZeroVar＆＃39;以某种方式？

我从文档中清楚地了解为什么以下代码不起作用，但我希望这澄清了我的问题。理想情况下，我可以做到以下几点。

library("caret")
set.seed (1234)
data (iris)

# split test vs training
train.index <- createDataPartition (y = iris[,5], p = 0.80, list = F)
train <- iris [ train.index, ]
test  <- iris [-train.index, ]

# train the model after imputing the missing data
fit <- train (Species ~ ., 
              train, 
              preProcess = c("findCorrelation", "nearZeroVar"), 
              method     = "rpart" )
predict (fit, test)

Answer 1

现在，你与preProcess将要做的事情联系在一起。

然而，下一个版本（我希望在今年年初左右）将允许您更轻松地编写自定义模型和预处理。例如，您可能希望对数据进行下采样等。

如果我们有可用的测试版，您是否愿意测试该版本。

最高

插入符号 - 列车中不提供某些预处理选项

1 个答案: