在插入符号包中,有一个名为trainControl的东西允许我们执行各种交叉验证。要执行10倍交叉验证,可以使用
fitControl <- trainControl(method= "repeatedcv", number = 10, repeats = 10)
fitJ48_10_fold <- train(x = x, y =y, method = "J48", trControl= fitControl)
而对于训练集,它是
fitControl <- trainControl(method= "none")
fitJ48train <- train(x = x, y =y, method = "J48", trControl= fitControl)
然而,这些模型的混淆矩阵在10倍和训练中表现相同。
Activity <- predict(fitJ48_10_fold, newdata = Train)
confusionMatrix(Activity, Train$Activity)
Activity <- predict(fitJ48train, newdata = Train)
confusionMatrix(Activity, Train$Activity)
我使用了weka分类器GUI,实际上,10倍交叉验证的J48性能低于训练集。我错误地怀疑来自插入符号的火车控制器是否正在工作或我以错误的方式通过它?
答案 0 :(得分:1)
我错误地怀疑来自插入符号的火车控制器是否正在工作或者我以错误的方式通过它?
一点点。对于J48
,有一个调整参数,但默认网格只适合单个值C = 0.25
。无论您在method
中使用trainControl
的值是什么,最终模型都是相同的,因此混淆矩阵将始终相同。
最高