我使用r在h2o中创建了一个随机森林。它有树木和树叶。
我想知道有多少叶子。我喜欢将总行数与叶子进行比较。
我有200棵树,8层深,每个叶子需要5行。我是否遍历了大部分数据?我有20k行。
有没有一种干净的方法可以计算h2o randomForest中的叶子数量?
答案 0 :(得分:2)
你会很高兴知道H2O存储这些信息!例如。 (这是针对Iris数据集)
req.meta['proxy']="http://52.71.9.25:8080"
打印m <- h2o.randomForest(1:4, 5, data)
时,我看到了:
m
所以有926个叶子(number_of_trees model_size_in_bytes min_depth max_depth mean_depth min_leaves max_leaves mean_leaves
150 20217 1 9 3.72667 21 15 6.17333
)。
使用代码获取它:
6.17333 * 150