我有一个包含3列的38K行的数据帧,我将其放入插入符号中的随机林进程中,前两列是字符类,第三列(我试图解释的是两个因素)。 以下是我用于函数调用的调整参数:
trControl <- trainControl(method = "repeatedcv", number=1, repeats=1)
rf_model <- train(YVar~., data=training, method="rf", trainControl = trControl, tuneLength = 1)
该模型需要很长时间才能运行...我在大约8小时后取消了... Python中的一个类似模型在几分钟内运行。我认为这是我用调整参数做的事情;我做过一些研究,有类似问题的人专注于减少交叉验证/重复的次数。
提前致谢。