我现在正在使用sklearn.ensemble中的RandomForestRegressor分析数据集,并选择“ mse”作为测量拆分质量的函数。但是我还不清楚mse的计算方式。有人可以在这里向我解释(更好地使用方程式),或者为我提供一些参考吗?预先谢谢你。
答案 0 :(得分:1)
如果我想很快回答这个作为成本函数方法之一的指标,如果您认为您的模型遵循下图中的绿线,而那些蓝点是您的数据MSE,其名称暗示的是平方和的平均值相对于线的所有数据点区域总代表您的模型错误。 MSE可以通过以下方式计算:
它显示我们的评价好坏。 较小 MSE,更好模型!
更多信息:
Understanding Regression Error Metrics in Python
Introduction to Loss Functions
更新30.05.2019 :要验证情况,您可以根据文档.RandomForestRegressor深入文档,有时甚至在代码中,MSE就是差异缩小作为特征选择标准,即使您检查源代码也可以将其用于衡量分割的质量。另一方面,如果您对.RandomForestRegressor
中的MSE方法存有疑问,则可以通过如下自定义criterion
来独立使用:
from sklearn.metrics import mean_squared_error
from sklearn.ensemble import RandomForestRegressor
#Feature Selection
criterion = mean_squared_error(y, predictions)
RandomForestRegressor( ...,criterion= criterion,...)
或使用numpy:
import numpy as np
criterion = np.mean((y_test - est.predict(X_test))**2)