我已经完成了Andrew Ng的机器学习课程,刚刚完成了学习曲线讲座。我为我创建的逻辑回归模型创建了一个学习曲线,看起来训练和CV得分收敛,这意味着我的模型可以从更多的功能中受益。我怎么能对像随机森林这样的东西进行类似的分析呢?当我为sklearn中的相同数据创建随机森林分类器的学习曲线时,我的训练分数非常接近1.我是否需要使用不同的方法来获得训练错误?
答案 0 :(得分:0)
学习曲线是了解bias-variance-trade-off的工具。由于您的随机森林模型训练分数非常接近1,您的随机森林模式l能够学习基础功能。如果您的基础功能更加非线性,更复杂,则必须添加更多功能。请参阅以下example,参见学习曲线。
仅从2个功能开始,训练您的随机森林模型。然后使用您的所有功能并随机训练您的模型。 您应该看到类似的图表。