有没有办法知道R在随机森林模型上走了多远?

时间:2019-10-21 08:51:16

标签: r random-forest diagnostics

我目前正在学习随机森林以及如何在R中创建它们。但是,正如我发现的那样,创建这些树可能是非常耗时的活动,有时我不知道R已经走了多远或是否走了崩溃了,所以我慌张地关闭了R。我使用randomForest包,我的代码如下:

model <- randomForest(def ~ ., 
                      data = mydataset, 
                      mtry = 4, 
                      ntree = 200, 
                      importance = TRUE)

有没有办法让R随时告诉我它已经走了多远,或者当它完成一棵树并持续到下一棵树时?

1 个答案:

答案 0 :(得分:1)

在这种情况下,通常需要寻找使函数更加冗长的参数。这通常类似于verbose = TRUE,但它有所不同,某些功能不提供任何详细设置。

在您的情况下,您只需查找randomForest的帮助(使用?randomForest::randomForest)来找到参数do.trace

  

do.trace
  如果设置为TRUE,则在运行randomForest时给出更详细的输出。如果设置为某个整数,则将为每个do.trace树打印运行输出。

换句话说,您可以通过以下方式启用详细信息:

model <- randomForest(def ~ ., data = mydataset, mtry = 4, 
                      ntree = 200, importance = TRUE, do.trace = TRUE)

或者,每100棵树打印一些反馈:

model <- randomForest(def ~ ., data = mydataset, mtry = 4, 
                      ntree = 200, importance = TRUE, do.trace = 100)

第一步,最好先检查一下功能手册。如果使用rstudio,则可以使用help窗格而不是使用???