我从朋友那里收到一些关于如何改进模型的建议,但我不能很好地遵循这条指令。请有人帮我解决一下吗?以下是我的预测模型
fit1 <- cforest(SWL ~ affect + negemo+ future+swear+sad
+negate+sexual+death + filler+leisure + conj+ funct +discrep + i
+future + past + bio + body + cogmech + death + cause + quant
+ future +incl + motion + sad + tentat + excl+insight +percept +posemo
+ppron +quant + relativ + space + article + age + s_all + s_sad + gender
, data = trainset1,
controls=cforest_unbiased(ntree=500, mtry= 1))
test_predict1<-predict(fit1, newdata=testset1, type='response')
我朋友的建议:
你只需运行循环,例如500次。在每个循环中,您可以创建data.frame的临时副本,然后随机切换所有SWL值。然后在完成混乱的data.frame上运行整个过程,最后保存总体精度。当它完成时你有例如500个保存的准确性,可以与您的最佳结果进行比较。