我的数据包含229907行和200列。我正在训练随机森林。我知道这需要时间。但不知道多少。在对此数据运行randomforest时,R变得无法响应。 “R控制台(64位)(无响应)”。我只是想知道它是什么意思? R是否仍在工作或已经停止工作,我应该关闭它并重新开始?
答案 0 :(得分:2)
RGui在长时间计算中没有反应是很常见的。如果你等了足够长的时间,它通常会回来。
运行时间不会随数据大小线性变化。使用默认参数,更多数据意味着要处理的观察次数和每棵树的更多节点。尝试使用ntree=1
构建一些小型森林,maxnodes
参数的不同值以及不同数据量,以了解应该花多长时间。让Windows任务管理器或类似工具同时打开,以便您可以监视CPU和RAM的使用情况。
你可以尝试的另一件事是制作一些小森林(ntree的小值),然后使用combine
函数制作一个大森林。
答案 1 :(得分:1)
您应该检查CPU使用率和内存使用情况。如果CPU仍然显示R进程的高使用率,则R可能仍然很强。
答案 2 :(得分:-2)
考虑切换到R 32位。出于某种原因,它似乎对我来说更稳定 - 即使我的系统完全能够支持64位。