随机森林中h2o的MOJO中的辅助树数据

时间:2018-02-02 09:57:01

标签: python r random-forest h2o

似乎h2o的随机森林算法的MOJO zip文件包含“辅助”树数据,大约占总MOJO文件大小的75%。

  1. 这个辅助树数据到底用于什么?
  2. 是否有必要为仅执行预测的已部署模型提供此数据?
  3. 如果没有,是否可以在调用h2o.download_mojo
  4. 时省略存储辅助数据

    感谢您的帮助。

1 个答案:

答案 0 :(得分:1)

  1. 统计。
  2. 例如,每个子节点的加权行数。

    您可以在此处查看AuxInfo数据结构:

    MOJO打印工具有一个特殊标记(--detail),可以打印出这些信息。

    请参阅此处使用的工具:

    1. 严格来说,没有。预测计算不需要“辅助”信息。
    2. 然而,我猜测当前的Java genmodel阅读器代码(3.16.0.4)如果不存在该信息,可能无法正确解析。

      (您可以通过解压缩mojo,删除该aux文件并再次重新拉链来尝试自己。)

      1. 不,截至当前版本(3.16.0.4),此功能不存在。