我正在尝试使用带有caret
库的R来训练分类器。
ctrl <- trainControl(method = "repeatedcv", number = 10 , savePred=T, classProb=T, verboseIter = T, search = "random" )
start = proc.time()
start
mod <- train(x = data$data, y = data$labels, method = "svmPoly", trControl = ctrl, preProcess = "pca")
end = proc.time()
最后,我的模型应该存储在mod
中,但我怎么知道哪个参数组合提供了最好的结果,特别是关于预处理。
我收到的有关预处理的唯一信息是
Pre-processing: principal component signal extraction (256), centered (256), scaled (256)
但是没有说出多少?
并且可以使用search = random
方法来检索更多信息,而不是我作为输出收到的3个绘图值。
degree scale C Accuracy Kappa
2 0.108317686 0.9567723 0.70400 0.6711111
3 0.004150808 0.5572215 0.67975 0.6441667
3 0.616741666 64.7776012 0.74825 0.7202778
答案 0 :(得分:0)
很难说出你在问什么,但这里有一些信息
preProcess
对所有预测变量执行相同的处理,因此看centered (256)
表示您有256个数字预测变量并且它们全部居中。例外情况是,如果您有非数字预测变量,则应该看到ignored
的条目。另请注意,如果通过公式接口生成虚拟变量,则256可能大于数据中的列数。 train
哪些预测变量应该预处理(并且可能采用不同的方式)最高