在Scikit Learn的随机森林回归器中,可以设置与修剪技术(docs)相关的ccp_alpha
参数,而我正在使用它来控制过拟合。
应用它后,我想使用此修剪的模型通过随机搜索执行超参数调整,并找到我的最佳模型。所以,我想要这个修剪过的模型。
是否有可能获得此修剪的模型?
答案 0 :(得分:1)
将.fit(X_train, y_train)
函数应用于RandomForestClassifier()
或RandomForestRegressor()
类的对象时,返回的拟合模型已经被修剪。
这发生在sklearn实现中。从理论上讲,RandomForest也不只是DecisionTree的组合,而是经过修剪,聚合并使用默认设置的多个大型决策树的自举版本。
请放心,由于修剪,此处返回的模型不会过拟合。如果您确实发现过拟合,建议您检查模型的o.b得分,并描述整个数据管道以获取进一步的建议
答案 1 :(得分:1)
从scikit-learn参阅此文档 https://scikitlearn.org/stable/auto_examples/tree/plot_cost_complexity_pruning.html
它包括使用成本复杂性实施修剪的详细说明。