我正在尝试了解随机森林以进行回归。我已经阅读了很多,但是仍然很难理解。我的理解是:随机森林对来自多个决策树的答案求平均。每个决策树都是使用不同的样本和不同的功能子集构建的。
但是,有些事情我还是不太了解。
- 如果我是对的,则使用节点拆分算法构建树。拆分节点是否有不同的算法是否正确?例如,我已经阅读了有关信息增益和减少标准偏差的信息。
- 在决策树的每个节点上是否仅考虑一项功能是真的吗?
- 从我的阅读中,我了解到决策树通过最小化隔离误差的总和以分段线性方式拟合数据。它是否正确?那么每个拟合的零件实际上是不是“正常的”(多维)线性回归?
- 随机森林如何进行预测?我了解到训练模型时,最终并不会获得要素系数的值。
希望有人可以更清楚地说明这一点!