何时使用随机森林

时间:2019-07-03 01:29:13

标签: python regression data-science random-forest

我了解随机森林模型可用于分类和回归情况。是否有更具体的标准来确定随机森林模型在哪里比常规回归(线性,套索等)来估计值或对数回归进行分类更好?

1 个答案:

答案 0 :(得分:1)

随机森林模型的思想是从一堆决策树构建的,它是一种监督的集成学习算法,可以减少单个决策树中的过度拟合问题。

机器学习的理论是,没有一个模型能胜过所有其他模型,因此,始终建议在获得最佳模型之前尝试不同的模型。

话虽如此,当人们处理不同性质的数据时,会有模型选择的偏爱。每个模型都对数据进行内在假设,而模型中与数据最一致的假设通常对数据更有效。例如,逻辑模型适用于具有平滑线性决策边界的分类数据,如果数据具有此功能,而随机森林则不具有平滑线性决策边界。因此,数据的性质会影响模型的选择,因此在得出结论之前尝试所有方法总是很有益的。