是否有必要在预测之前对数据进行居中和缩放?

时间:2016-01-07 12:14:49

标签: r r-caret

在插入符号包的训练功能中,可以执行预测变量的居中和缩放,如下例所示:

pred <- predict(knnFit, newdata = test)

在训练中设置此转换应该可以更好地评估重采样过程中算法的性能。

在这种情况下,当我使用模型来预测新数据的响应时,我是否应关注居中和缩放,或者此操作是否包含在最终模型中?

以下操作是否足够?

.collapse('show')

谢谢!

1 个答案:

答案 0 :(得分:4)

列车对象中指定的preProces将应用于新数据,而无需先预处理新数据。所以你的操作就足够了。

另请参阅下面的插入符号网站的摘录。还有一整个部分纯粹是关于预处理。绝对值得你花时间阅读它。

您可以在此处找到caret website

  

这些处理步骤将在任何预测期间应用   使用predict.train,extractPrediction或extractProbs生成(参见   本文后面的详细信息)。预处理不会   应用于直接使用对象$ finalModel对象的预测。