这个问题很大程度是从解决方案到this question的起点。 鉴于我可以使用R来生成mojo模型对象:
java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png
然后bash / graphviz生成该模型的树形图:
with initial_totals as (
select task_cd
, status
, count(*) as totals
, sum(case when due_date >= trunc(sysdate) + 1 then 1 else 0 end) as future
, sum(case when trunc(due_date) = trunc(sysdate) then 1 else 0 end) as today
, sum(case when due_date < trunc(sysdate) then 1 else 0 end) as overdue
from tm_task
group by task_cd, status
)
select task_cd
, status
, future
, today
, overdue
, sum(future) over (partition by task_cd) as future_total
, sum(today) over (partition by task_cd) as today_total
, sum(overdue) over (partition by task_cd) as overdue_total
from initial_totals
如何解释此可视化中的值和决策以及终端节点上的值?第二层的NA是什么?如果终端节点中的值是“类别概率”,它们怎么可以是负数?
是否可以可视化或概念化模型中所有树的“摘要树”?
如何生成一个图表以使用颜色或形状来指示末端节点中项目的二进制分类?
答案 0 :(得分:1)
有一种更好的方法来使用H2O构建决策树-无需提取MOJO或离开R / Python-使用新的Tree API(从3.22.0.1开始)。有关详细说明,请参见: