在对大量数据运行randomforest时,R变得没有响应。这是否意味着它仍在运行或已停止工作?

时间:2013-06-11 12:04:00

标签: r random-forest

我的数据包含229907行和200列。我正在训练随机森林。我知道这需要时间。但不知道多少。在对此数据运行randomforest时,R变得无法响应。 “R控制台(64位)(无响应)”。我只是想知道它是什么意思? R是否仍在工作或已经停止工作,我应该关闭它并重新开始?

3 个答案:

答案 0 :(得分:2)

RGui在长时间计算中没有反应是很常见的。如果你等了足够长的时间,它通常会回来。

运行时间不会随数据大小线性变化。使用默认参数,更多数据意味着要处理的观察次数和每棵树的更多节点。尝试使用ntree=1构建一些小型森林,maxnodes参数的不同值以及不同数据量,以了解应该花多长时间。让Windows任务管理器或类似工具同时打开,以便您可以监视CPU和RAM的使用情况。

你可以尝试的另一件事是制作一些小森林(ntree的小值),然后使用combine函数制作一个大森林。

答案 1 :(得分:1)

您应该检查CPU使用率和内存使用情况。如果CPU仍然显示R进程的高使用率,则R可能仍然很强。

答案 2 :(得分:-2)

考虑切换到R 32位。出于某种原因,它似乎对我来说更稳定 - 即使我的系统完全能够支持64位。