找出TensorFlow的BoostedTrees逐层方法

时间:2019-04-02 13:00:14

标签: python tensorflow

我一直在the paper中阅读与TensorFlow中增强树的实现相关的文章,其中讨论了逐层方法

  

...以及新颖的逐层增强功能,可增强树木强度   (导致更快的收敛)和更深层次的模型。

尽管本文中没有讨论这种方法。 我很确定n_batches_per_layer parameter passed in the BosstedTreesClassifier/Regressor与这个概念有关。

我的问题是

  1. 这是什么方法?有任何资料可以进一步了解吗?
  2. n_batches_per_layer参数的含义是什么?
  3. 我应该设置n_batches_per_layer参数来遵循标准的强化树训练方案吗?

1 个答案:

答案 0 :(得分:1)

n_batches_per_layer是您要用于每层训练的批次数量(即树中给定的深度)。基本上,它是构建1层数据的一部分,是分批测量的。例如,如果您设置batch size = len(train_set)n_batches_per_layer = 1,则将为每个图层使用整个火车集。

因此,我建议如果它们的数据集适合内存,然后设置batch_size = len(train_set),即n_batches_per_layer = len(train_set)的数量。否则将其设置为int(len(train_data)/batch_size) -尽管您可以尝试使用较小的数字进行实验以加快训练速度。