Question

如何解析cforest / ctree从数据中的列数构建树的时间？

我认为可以使用选项mtry来做到这一点，即帮助说

输入变量的数量随机抽样为每个节点的候选者，用于随机林类算法。

但是，虽然它确实使输出树随机化，但它不会将CPU时间与列数分离，例如

p<-proc.time()

ctree(gs.Fit~.,
      data=Aspekte.Fit[,1:60],
      controls=ctree_control(mincriterion=0,
                             maxdepth=2,
                             mtry=1))

proc.time()-p

的时间是Aspekte.Fit[,1:30]的两倍（顺便说一下，所有变量都是布尔值）。为什么？它在哪里随着列数而缩放？

我认为算法应该：

在每个节点上随机选择两列。
使用它们来分割响应。（由于mincriterion=0）
继续前进到下一个节点（由maxdepth=2组成的总共3个）

不受列总数的影响。

指出我的方式错误

一个无休止的cforest

0 个答案: