我正在研究一个项目,我使用了mean_square_error
中的skelarn
来获取我的MSE和RMSE。
我不明白这些信息的含义。
我正在使用有关房屋销售的数据集,我想使用线性回归预测房屋的价格。当我输入预测价格和实际价格时,我得到了结果:
MSE:1114197668.6920328 RMSE:33379.59958855158
这些信息实际上意味着什么?我的预测会发现33379.60
的价格有平均差异吗?
MSE = mean_squared_error(predict,testSalePrice)
RMSE = np.sqrt(MSE)
答案 0 :(得分:2)
在统计中,均方误差(MSE)或均方差 (MSD)的估算器(用于估算未观察到的过程的 数量)测量误差平方的平均值。
因此,例如,假设您有三个数据点:
Price Predicted
1900 2000
2000 2000
2100 2000
则MSE为:1/3 * ((-100)*(-100)+ (0)*(0) + (100)*(100)) = 1/3 * (20000) = 6000
完美的数字是0,但是您可能无法达到。您必须将其与实际值范围进行比较。
在这种情况下,RMSE为:SQRT(6000) = 77,..
这是更加可理解的,这意味着您平均比预期高77,如果您看到三个结果,这是有道理的