渐变中的渐变增强树如何工作?

时间:2014-12-11 23:38:26

标签: tree machine-learning binary-tree gradient

我在理解Gradient Boosted Trees如何工作时遇到了问题。我试着在这里关注此链接:

http://www.statsoft.com/Textbook/Boosting-Trees-Regression-Classification

但这不是很有帮助。所以我的印象是

  1. 您将数据划分为分区
  2. 您尝试找到最适合预测每个分区上数据点的行
  3. 您计算每个分区的某种错误(残差平方和)
  4. 您创建了另一棵树,并根据前一棵树的错误,尝试找到另一个分区,它将进一步减少整个等式的整体RSS并重复,直到您创建了一定数量的树。
  5. 我对以下几个方面感到困惑:

    这些分区有什么意义?为什么我不能在没有分区的情况下找到树的RSS?另外,我读到最终预测值是通过添加每棵树的加权贡献而形成的。每棵树的输出是什么?每棵树是否输出了自己对最终预测值的预测?每棵树是由什么制成的?

    如果你能告诉我,我将不胜感激。谢谢!

0 个答案:

没有答案