我使用CARET包来微调随机森林mtry参数。在包中,tunelength参数可用于自动搜索最佳mtry参数。但问题是" tunelength"当我在交叉验证中设置最小2倍时工作。当我不想进行交叉验证时,它不起作用。
ctrl <- trainControl(method = "cv", classProbs = TRUE, summaryFunction = twoClassSummary, number = 2)
set.seed(2)
trained <- train(Y ~ . , data = mydata, method = "rf", ntree = 500, tunelength = 10, metric = "ROC", trControl = ctrl, importance = TRUE)
有谁知道tunelength的默认设置?我的意思是mtry的哪个值,它将从它开始。
答案 0 :(得分:2)
我认为你不明白参数调整意味着什么。您希望选择最佳的参数组合来改善某些质量测量。问题是这个质量测量不能在训练集本身上计算,因为这会导致过度拟合。交叉验证可以精确地为您提供无偏估计的质量指标。