在插入符号包的训练功能中,可以执行预测变量的居中和缩放,如下例所示:
pred <- predict(knnFit, newdata = test)
在训练中设置此转换应该可以更好地评估重采样过程中算法的性能。
在这种情况下,当我使用模型来预测新数据的响应时,我是否应关注居中和缩放,或者此操作是否包含在最终模型中?
以下操作是否足够?
.collapse('show')
谢谢!
答案 0 :(得分:4)
列车对象中指定的preProces将应用于新数据,而无需先预处理新数据。所以你的操作就足够了。
另请参阅下面的插入符号网站的摘录。还有一整个部分纯粹是关于预处理。绝对值得你花时间阅读它。
您可以在此处找到caret website。
这些处理步骤将在任何预测期间应用 使用predict.train,extractPrediction或extractProbs生成(参见 本文后面的详细信息)。预处理不会 应用于直接使用对象$ finalModel对象的预测。