提取用于在H2O中构建每棵树的功能的样本

时间:2019-02-22 04:42:17

标签: r h2o

在GBM模型中,使用以下参数-

  • col_sample_rate
  • col_sample_rate_per_tree
  • col_sample_rate_change_per_level

我了解采样的工作原理,并考虑为每个树在每个级别进行拆分的变量数量。我试图了解每个功能要考虑多少次才能做出决定。有没有一种方法可以轻松地从模型对象中提取用于做出决策的所有特征样本?

参考H2O http://docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params/col_sample_rate.html提供的解释,是否有办法知道每个拆分的60个随机选择的特征?

谢谢您的帮助!

2 个答案:

答案 0 :(得分:1)

如果要查看给定树中给定拆分使用了哪些功能,可以导航H2OTree对象。

有关R,请参见文档herehere

对于Python,请参见文档here

您也可以看看此Blog(如果此链接消失了,只需在Google上搜索H2OTree类即可)

答案 1 :(得分:0)

我不知道我是否会这么称呼,但是MOJO树可视化工具会吐出一个graphviz点数据文件,该文件会变成可视化文件。这包含您感兴趣的信息。

http://docs.h2o.ai/h2o/latest-stable/h2o-genmodel/javadoc/overview-summary.html#viewing-a-mojo