一个无休止的cforest

时间:2013-06-26 17:26:21

标签: r random-forest

如何解析cforest / ctree从数据中的列数构建树的时间?

我认为可以使用选项mtry来做到这一点,即帮助说

  

输入变量的数量随机抽样为每个节点的候选者,用于随机林类算法。

但是,虽然它确实使输出树随机化,但它不会将CPU时间与列数分离,例如

p<-proc.time()

ctree(gs.Fit~.,
      data=Aspekte.Fit[,1:60],
      controls=ctree_control(mincriterion=0,
                             maxdepth=2,
                             mtry=1))

proc.time()-p

的时间是Aspekte.Fit[,1:30]的两倍(顺便说一下,所有变量都是布尔值)。为什么?它在哪里随着列数而缩放?

我认为算法应该:

  1. 在每个节点上随机选择两列。
  2. 使用它们来分割响应。 (由于mincriterion=0
  3. 没有缩放
  4. 继续前进到下一个节点(由maxdepth=2组成的总共3个)
  5. 不受列总数的影响。

    指出我的方式错误

0 个答案:

没有答案