在拟合RandomForestClassifier时爆炸内存使用情况

时间:2013-01-31 01:38:29

标签: python numpy scikit-learn

我正在尝试使用中等大小的numpy浮标装载森林

In [3]: data.shape
Out[3]: (401125, 5)

[...]
forest = forest.fit(data[:,1:],data[:,0])

问题发生在拟合开始后10秒。它冻结我的机器之前需要高达3.6 GB(3.8 GB)的内存,我不得不终止这个过程。

我一直在研究,当你将n_jobs设置为大于1的东西时,这个问题似乎很常见。但我使用的是n_jobs的默认值,即1。

我也尝试将n_estimators从我的初始值100改为5,只是为了看看是否发生了不同的事情,但一切都保持不变。

有人能否对此有所了解?

谢谢!

1 个答案:

答案 0 :(得分:0)

糟糕。我实际上是想做一个回归,而不是分类。 结束问题。