我正在使用Python中的H2O来可视化回归树。 https://github.com/h2oai/h2o-tutorials/blob/master/tutorials/display_tree_mojo/DisplayTreeMojoH2O.ipynb
以上示例提供了使用PrintMOJO的方法。但是,输出图不包括每个节点的样本大小(以及节点的平均值)。在SKLearn中包含了样本量和平均值,但我不知道如何将它们整合到H2O中。
这就是我要寻找的: http://www.netinstructions.com/content/images/2015/07/decision-tree-visualized.png
有什么主意吗?
我寻找了很多资源,但是我不知道应该使用哪个选项或变量来实现这一目标。如果我切换到R,这会使事情变得容易吗?
答案 0 :(得分:0)
如果向PrintMojo树打印工具提供“ -detail”参数,则会获得更多信息。
尤其是,您将看到每个节点的权重,这是传递给该节点的行权重的总和。 (每行的默认权重为1.0,但是您可以通过提供权重列来逐行更改它。)
PrintMojo的源代码在这里: