使用默认参数进行decisiontree
回归时,我得到R2值“ -1.3 ”。这意味着什么,我的模型好吗?均方误差也是不合理的。我可以通过改变分类器的参数来使它变为正面。
http://scikit-learn.org/stable/modules/generated/sklearn.metrics.r2_score.html
from sklearn.metrics import r2_score, mean_squared_error
答案 0 :(得分:0)
负R2表示过度拟合,这对于适用于小型或嘈杂训练数据的未调整决策树来说非常典型。
您可以通过使用例如调整决策树的参数来解决此问题。 grid search - 将max_depth
设置为较小的值可能会使模型在您的情况下表现更好。
更好的方法是更改为Random Forest模型,该模型使用决策树的集合来更自动地校正这种过度拟合(尽管通过网格搜索进行调整对于进一步优化结果仍然很重要)