以rpart frame等格式提取随机森林

时间:2016-08-06 13:00:28

标签: r random-forest h2o

以下代码:

library(randomForest)
z.auto <- randomForest(Mileage ~ Weight, 
                       data=car.test.frame,
                       ntree=1,
                       nodesize = 15)
tree <- getTree(z.auto,k=1,labelVar = T)
tree

将此作为文本输出:

   left daughter right daughter split var split point status prediction
1              2              3    Weight      2567.5     -3   24.45000
2              0              0      <NA>         0.0     -1   30.66667
3              4              5    Weight      3087.5     -3   22.37778
4              6              7    Weight      2747.5     -3   24.00000
5              8              9    Weight      3637.5     -3   19.94444
6              0              0      <NA>         0.0     -1   25.20000
7             10             11    Weight      2770.0     -3   23.29412
8              0              0      <NA>         0.0     -1   21.18182
9              0              0      <NA>         0.0     -1   18.00000
10             0              0      <NA>         0.0     -1   22.50000
11             0              0      <NA>         0.0     -1   23.72727

根据这些数据,我可以看到单个树的逻辑。

如何根据这个来获取更长的表,它描述了随机森林中的所有树,来自h2o?

我喜欢&#39; h2o&#39;因为它干净地使用了所有核心,并且在我的系统上有一个相当不错的剪辑。这是一个很好的工具。然而,它是一个独立于&#39; r&#39;所以我不确定如何访问我的数据的各个部分。

如何从h2o随机森林中以csv文件的形式获得上述打印输出?

1 个答案:

答案 0 :(得分:1)

H2O当前没有显示这样的表的功能,但您可以使用以下方法将随机林模型导出到POJO(Java文件) h2o.download_pojo()函数然后手动检查树(单个规则)。

H2O也接受feature requests