我正在尝试使用插入符号包中的列车功能来构建模型:
model <- train(training$class ~ .,data=training, method = "nb")
训练集包含大约20K的观测值,每个观测值都有100个以上的变量。我想知道从该数据集构建模型是否需要数小时或数天。
如何估算从数据中训练模型所需的时间?如何使用插入符号包中的函数来跟踪培训过程的进度?
答案 0 :(得分:29)
假设您正在使用
训练模型你可以设置
trainctrl <- trainControl(verboseIter = TRUE)
并将其设置在train函数的trControl参数中以跟踪训练进度
model <- train(training$class ~ .,data=training, method = 'nb', trControl = trainctrl)
这会在每个重新采样阶段打印出控制台的进度,并允许您衡量训练/参数调整的进度。
要估算总运行时间,您可以运行模型一次以查看其运行时间,并根据重新采样方案和参数组合数量相应地乘以估算总时间。这可以通过再次设置trainControl并将tuneLength设置为1来完成:
trainctrl <- trainControl(method = 'none')
model <- train(training$class ~ ., data = training, method = 'nb', trControl = trainctrl, tuneLength = 1)
希望这有帮助! :)