R - Party - 随机森林计算如何运作?

时间:2015-09-21 22:50:49

标签: r classification random-forest party

我正在使用cforest()中的party package运行我的第一个随机森林算法。每次运行cforest算法时,RStudio都会在发送错误消息"Error: cannot allocate vector of size 927 Kb"后崩溃,这是一个非常小的向量...

我尝试使用控件,参数非常低以达到底部,但即使使用controls = cforest_unbiased(ntree=2, mtry=3),它仍然会使用相同的消息崩溃。

这里是完整的代码行:

forest.result.balance$model.1$forest <- cforest(formula = quotation ~ minute + temp + humidity, data=undersamp.train, controls = cforest_unbiased(ntree=2, mtry=3))

为了让你更好地理解会发生什么,我的二进制因变量取值01,长度为120k,我有3个连续的自变量。 此外,我一直跟踪计算过程中对内存使用的影响,并在崩溃之前达到RSGudio的5Gb。

那么,你知道我怎么能解决这个问题并向我解释发生了什么事情,因为在另一个没有问题之后运行了几个ctree但是由两棵树组成的单个cforest不是&#39 ;吨

编辑:

我通过将训练样本减少50%找到了解决方法,但现在我遇到了与预测相同的问题,在这种情况下,在内存使用方面存在大量问题,而如果我是正确的话,它应该只应用分类规则。这是一个补充问题,但没有回答上一个问题,因为我不认为减少培训样本应该是答案......

编辑2:

以下对我的数据的补充iformation:

str(undersamp.train)
#
Classes ‘tbl_df’, ‘tbl’ and 'data.frame':   68226 obs. of  6 variables:
 $ quotation: Factor w/ 2 levels "0","1": 2 2 2 2 2 2 2 2 2 2 ...
     $ minute   : int  519 922 762 670 793 732 611 848 549 1233 ...
 $ weekday  : int  2 4 0 0 5 0 2 4 3 3 ...
     $ temp     : num  10.23 5.84 13.92 -7.48 6 ...
 $ humidity : num  74.8 95.7 81.8 89.1 98 ...
     $ pressure : num  1027 1023 1017 983 1020 ...

0 个答案:

没有答案
相关问题