为其他指标优化RandomForestRegressor

时间:2014-07-17 12:37:15

标签: python scikit-learn

sklearn random forest的文档页面说

  

唯一支持的标准是均方误差的“mse”。

我的数据很乱并且有异常值,我觉得MAE或一些强大的惩罚函数会表现得更好。

是否有一种方法可以将随机森林回归量用于其他度量,例如迭代,或者是否有其他python开源替代,或者我的假设是要求其他指标本身错误? Sklearn在其他领域非常发达,所以对我来说这似乎很奇怪,只有mse支持像随机森林这样重要的方法。

1 个答案:

答案 0 :(得分:4)

您可以使用GridSearchCVRandomizedSearchCV针对交叉验证循环中的其他条件进行优化。森林本身仍将针对MSE进行优化,但CV循环在所选参数设置中找到森林,以优化您感兴趣的实际标准。(并且它优化CV分数,而不是训练集分数。)< / p>