来自sklearn.metrics的尴尬结果

时间:2015-11-13 14:49:20

标签: scikit-learn scikits

使用默认参数进行decisiontree回归时,我得到R2值“ -1.3 ”。这意味着什么,我的模型好吗?均方误差也是不合理的。我可以通过改变分类器的参数来使它变为正面。

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html

from sklearn.metrics import r2_score, mean_squared_error

1 个答案:

答案 0 :(得分:0)

负R2表示过度拟合,这对于适用于小型或嘈杂训练数据的未调整决策树来说非常典型。

您可以通过使用例如调整决策树的参数来解决此问题。 grid search - 将max_depth设置为较小的值可能会使模型在您的情况下表现更好。

更好的方法是更改​​为Random Forest模型,该模型使用决策树的集合来更自动地校正这种过度拟合(尽管通过网格搜索进行调整对于进一步优化结果仍然很重要)