H2O Mojo / Pojo中的分类树图

时间:2018-11-19 20:28:01

标签: r graphviz h2o gbm

这个问题很大程度是从解决方案到this question的起点。 鉴于我可以使用R来生成mojo模型对象:

java -cp h2o.jar hex.genmodel.tools.PrintMojo --tree 0 -i airlinemodel.zip -o airlinemodel.gv
dot -Tpng airlinemodel.gv -o airlinemodel.png

然后bash / graphviz生成该模型的树形图:

with initial_totals as (
select task_cd
     , status
     , count(*) as totals
     , sum(case when due_date >= trunc(sysdate) + 1 then 1 else 0 end) as future
     , sum(case when trunc(due_date) = trunc(sysdate) then 1 else 0 end) as today
     , sum(case when due_date < trunc(sysdate) then 1 else 0 end) as overdue
  from tm_task
 group by task_cd, status
       )
select task_cd
     , status
     , future
     , today
     , overdue
     , sum(future) over (partition by task_cd) as future_total
     , sum(today) over (partition by task_cd) as today_total
     , sum(overdue) over (partition by task_cd) as overdue_total
  from initial_totals

Example GBM Tree Diagram 我的问题是三个方面:

  1. 如何解释此可视化中的值和决策以及终端节点上的值?第二层的NA是什么?如果终端节点中的值是“类别概率”,它们怎么可以是负数?

    1. 是否可以可视化或概念化模型中所有树的“摘要树”?

    2. 如何生成一个图表以使用颜色或形状来指示末端节点中项目的二进制分类?

1 个答案:

答案 0 :(得分:1)

有一种更好的方法来使用H2O构建决策树-无需提取MOJO或离开R / Python-使用新的Tree API(从3.22.0.1开始)。有关详细说明,请参见:

  1. Inspecting Decision Trees with H2O
  2. Finally, You can Plot H2O Decision Trees in R