Question

以下代码：

library(randomForest)
z.auto <- randomForest(Mileage ~ Weight, 
                       data=car.test.frame,
                       ntree=1,
                       nodesize = 15)
tree <- getTree(z.auto,k=1,labelVar = T)
tree

将此作为文本输出：

   left daughter right daughter split var split point status prediction
1              2              3    Weight      2567.5     -3   24.45000
2              0              0      <NA>         0.0     -1   30.66667
3              4              5    Weight      3087.5     -3   22.37778
4              6              7    Weight      2747.5     -3   24.00000
5              8              9    Weight      3637.5     -3   19.94444
6              0              0      <NA>         0.0     -1   25.20000
7             10             11    Weight      2770.0     -3   23.29412
8              0              0      <NA>         0.0     -1   21.18182
9              0              0      <NA>         0.0     -1   18.00000
10             0              0      <NA>         0.0     -1   22.50000
11             0              0      <NA>         0.0     -1   23.72727

根据这些数据，我可以看到单个树的逻辑。

如何根据这个来获取更长的表，它描述了随机森林中的所有树，来自h2o？

我喜欢＆＃39; h2o＆＃39;因为它干净地使用了所有核心，并且在我的系统上有一个相当不错的剪辑。这是一个很好的工具。然而，它是一个独立于＆＃39; r＆＃39;所以我不确定如何访问我的数据的各个部分。

如何从h2o随机森林中以csv文件的形式获得上述打印输出？

Answer 1

H2O当前没有显示这样的表的功能，但您可以使用以下方法将随机林模型导出到POJO（Java文件） h2o.download_pojo（）函数然后手动检查树（单个规则）。

H2O也接受feature requests。

以rpart frame等格式提取随机森林

1 个答案: