我正在使用cforest()
中的party package
运行我的第一个随机森林算法。每次运行cforest算法时,RStudio都会在发送错误消息"Error: cannot allocate vector of size 927 Kb"
后崩溃,这是一个非常小的向量...
我尝试使用控件,参数非常低以达到底部,但即使使用controls = cforest_unbiased(ntree=2, mtry=3)
,它仍然会使用相同的消息崩溃。
这里是完整的代码行:
forest.result.balance$model.1$forest <- cforest(formula = quotation ~ minute + temp + humidity, data=undersamp.train, controls = cforest_unbiased(ntree=2, mtry=3))
为了让你更好地理解会发生什么,我的二进制因变量取值0
和1
,长度为120k,我有3个连续的自变量。
此外,我一直跟踪计算过程中对内存使用的影响,并在崩溃之前达到RSGudio的5Gb。
那么,你知道我怎么能解决这个问题并向我解释发生了什么事情,因为在另一个没有问题之后运行了几个ctree
但是由两棵树组成的单个cforest
不是&#39 ;吨
编辑:
我通过将训练样本减少50%找到了解决方法,但现在我遇到了与预测相同的问题,在这种情况下,在内存使用方面存在大量问题,而如果我是正确的话,它应该只应用分类规则。这是一个补充问题,但没有回答上一个问题,因为我不认为减少培训样本应该是答案......
编辑2:
以下对我的数据的补充iformation:
str(undersamp.train)
#
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 68226 obs. of 6 variables:
$ quotation: Factor w/ 2 levels "0","1": 2 2 2 2 2 2 2 2 2 2 ...
$ minute : int 519 922 762 670 793 732 611 848 549 1233 ...
$ weekday : int 2 4 0 0 5 0 2 4 3 3 ...
$ temp : num 10.23 5.84 13.92 -7.48 6 ...
$ humidity : num 74.8 95.7 81.8 89.1 98 ...
$ pressure : num 1027 1023 1017 983 1020 ...