我怎么知道哪个预处理用于模型?

时间:2016-06-04 07:25:55

标签: r r-caret

我正在尝试使用带有caret库的R来训练分类器。

ctrl <- trainControl(method = "repeatedcv", number = 10 , savePred=T, classProb=T, verboseIter = T, search = "random" )
start = proc.time()
start
mod <- train(x = data$data, y = data$labels, method = "svmPoly", trControl = ctrl, preProcess = "pca")
end = proc.time()

最后,我的模型应该存储在mod中,但我怎么知道哪个参数组合提供了最好的结果,特别是关于预处理。

我收到的有关预处理的唯一信息是

Pre-processing: principal component signal extraction (256), centered (256), scaled (256) 

但是没有说出多少?

并且可以使用search = random方法来检索更多信息,而不是我作为输出收到的3个绘图值。

  degree  scale        C           Accuracy  Kappa    
  2       0.108317686   0.9567723  0.70400   0.6711111
  3       0.004150808   0.5572215  0.67975   0.6441667
  3       0.616741666  64.7776012  0.74825   0.7202778 

1 个答案:

答案 0 :(得分:0)

很难说出你在问什么,但这里有一些信息

  • 现在,preProcess对所有预测变量执行相同的处理,因此看centered (256)表示您有256个数字预测变量并且它们全部居中。例外情况是,如果您有非数字预测变量,则应该看到ignored的条目。另请注意,如果通过公式接口生成虚拟变量,则256可能大于数据中的列数。
  • 很快你就可以告诉train哪些预测变量应该预处理(并且可能采用不同的方式)

最高