通常,我们使用 RMSE 来评估模型的性能。我很好奇为什么我们使用平均残差来代替RMSE?
RMSE 的定义:
此处提到的平均残差是:
例如:
我们有三个样本:0 1 2
这些样品的预测值为:0 2 10
因此平均残差为
RMSE为
那么这两个值之间的差异是什么?
答案 0 :(得分:1)
(我将参考RMSE和"平均残差" 损失函数)
答案 1 :(得分:0)
RMSE除了是凸函数外,与高斯分布紧密相关,因为RMSE具有与Normal的标准偏差类似的表达式。
正态分布得到很好的研究,并且在自然科学中发现的各种随机过程中自然发生。将误差等于正态分布的扩展在很多情况下是有帮助的,例如log-likelihood(https://www.statlect.com/fundamentals-of-statistics/normal-distribution-maximum-likelihood),log-posterior(http://www.utstat.toronto.edu/~rsalakhu/sta4273/notes/Lecture2.pdf查看证据近似幻灯片)优化等。