以下代码:
library(randomForest)
z.auto <- randomForest(Mileage ~ Weight,
data=car.test.frame,
ntree=1,
nodesize = 15)
tree <- getTree(z.auto,k=1,labelVar = T)
tree
将此作为文本输出:
left daughter right daughter split var split point status prediction
1 2 3 Weight 2567.5 -3 24.45000
2 0 0 <NA> 0.0 -1 30.66667
3 4 5 Weight 3087.5 -3 22.37778
4 6 7 Weight 2747.5 -3 24.00000
5 8 9 Weight 3637.5 -3 19.94444
6 0 0 <NA> 0.0 -1 25.20000
7 10 11 Weight 2770.0 -3 23.29412
8 0 0 <NA> 0.0 -1 21.18182
9 0 0 <NA> 0.0 -1 18.00000
10 0 0 <NA> 0.0 -1 22.50000
11 0 0 <NA> 0.0 -1 23.72727
根据这些数据,我可以看到单个树的逻辑。
如何根据这个来获取更长的表,它描述了随机森林中的所有树,来自h2o?
我喜欢&#39; h2o&#39;因为它干净地使用了所有核心,并且在我的系统上有一个相当不错的剪辑。这是一个很好的工具。然而,它是一个独立于&#39; r&#39;所以我不确定如何访问我的数据的各个部分。
如何从h2o随机森林中以csv文件的形式获得上述打印输出?
答案 0 :(得分:1)
H2O当前没有显示这样的表的功能,但您可以使用以下方法将随机林模型导出到POJO(Java文件) h2o.download_pojo()函数然后手动检查树(单个规则)。
H2O也接受feature requests。