插入符号 - 列车中不提供某些预处理选项

时间:2013-11-20 15:04:31

标签: r r-caret

在插入符号:: train中,有许多预处理选项可以通过“预处理”来传递。论点。这使得生活变得非常简单,因为在调用“预测”时,测试数据会以与训练数据相同的方式自动进行预处理。 是否可以使用' findCorrelation'和' nearZeroVar'以某种方式?

我从文档中清楚地了解为什么以下代码不起作用,但我希望这澄清了我的问题。理想情况下,我可以做到以下几点。

library("caret")
set.seed (1234)
data (iris)

# split test vs training
train.index <- createDataPartition (y = iris[,5], p = 0.80, list = F)
train <- iris [ train.index, ]
test  <- iris [-train.index, ]

# train the model after imputing the missing data
fit <- train (Species ~ ., 
              train, 
              preProcess = c("findCorrelation", "nearZeroVar"), 
              method     = "rpart" )
predict (fit, test)

1 个答案:

答案 0 :(得分:1)

现在,你与preProcess将要做的事情联系在一起。

然而,下一个版本(我希望在今年年初左右)将允许您更轻松地编写自定义模型和预处理。例如,您可能希望对数据进行下采样等。

如果我们有可用的测试版,您是否愿意测试该版本。

最高