如何解析cforest / ctree从数据中的列数构建树的时间?
我认为可以使用选项mtry
来做到这一点,即帮助说
输入变量的数量随机抽样为每个节点的候选者,用于随机林类算法。
但是,虽然它确实使输出树随机化,但它不会将CPU时间与列数分离,例如
p<-proc.time()
ctree(gs.Fit~.,
data=Aspekte.Fit[,1:60],
controls=ctree_control(mincriterion=0,
maxdepth=2,
mtry=1))
proc.time()-p
的时间是Aspekte.Fit[,1:30]
的两倍(顺便说一下,所有变量都是布尔值)。为什么?它在哪里随着列数而缩放?
我认为算法应该:
mincriterion=0
)maxdepth=2
组成的总共3个)不受列总数的影响。
指出我的方式错误