我目前正在学习随机森林以及如何在R中创建它们。但是,正如我发现的那样,创建这些树可能是非常耗时的活动,有时我不知道R已经走了多远或是否走了崩溃了,所以我慌张地关闭了R。我使用randomForest包,我的代码如下:
model <- randomForest(def ~ .,
data = mydataset,
mtry = 4,
ntree = 200,
importance = TRUE)
有没有办法让R随时告诉我它已经走了多远,或者当它完成一棵树并持续到下一棵树时?
答案 0 :(得分:1)
在这种情况下,通常需要寻找使函数更加冗长的参数。这通常类似于verbose = TRUE
,但它有所不同,某些功能不提供任何详细设置。
在您的情况下,您只需查找randomForest
的帮助(使用?randomForest::randomForest
)来找到参数do.trace
。
do.trace
如果设置为TRUE,则在运行randomForest时给出更详细的输出。如果设置为某个整数,则将为每个do.trace树打印运行输出。
换句话说,您可以通过以下方式启用详细信息:
model <- randomForest(def ~ ., data = mydataset, mtry = 4,
ntree = 200, importance = TRUE, do.trace = TRUE)
或者,每100棵树打印一些反馈:
model <- randomForest(def ~ ., data = mydataset, mtry = 4,
ntree = 200, importance = TRUE, do.trace = 100)
第一步,最好先检查一下功能手册。如果使用rstudio,则可以使用help
窗格而不是使用?
或??
。