如何在H2O树可视化中包括每个节点的样本大小

时间:2019-06-03 15:03:14

标签: python h2o mojo

我正在使用Python中的H2O来可视化回归树。 https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/display_tree_mojo/DisplayTreeMojoH2O.ipynb

以上示例提供了使用PrintMOJO的方法。但是,输出图不包括每个节点的样本大小(以及节点的平均值)。在SKLearn中包含了样本量和平均值,但我不知道如何将它们整合到H2O中。

这就是我要寻找的: http://www.netinstructions.com/content/images/2015/07/decision-tree-visualized.png

有什么主意吗?

我寻找了很多资源,但是我不知道应该使用哪个选项或变量来实现这一目标。如果我切换到R,这会使事情变得容易吗?

1 个答案:

答案 0 :(得分:0)

如果向PrintMojo树打印工具提供“ -detail”参数,则会获得更多信息。

尤其是,您将看到每个节点的权重,这是传递给该节点的行权重的总和。 (每行的默认权重为1.0,但是您可以通过提供权重列来逐行更改它。)

PrintMojo的源代码在这里: