在关于神经网络和深度学习的online textbook中,作者用最小化二次成本函数来说明神经网络基础知识,他说这是均方误差的同义词。但有两件事让我对他的功能感到困惑(下面的伪代码)。
MSE≡(1 / 2n)后*Σ‖y_true-y_pred‖^ 2
非常感谢您提供的任何见解!
答案 0 :(得分:2)
成本函数乘以的0.5因子并不重要。事实上,你可以将它乘以你想要的任何实常数,并且学习将是相同的。它仅用于使得成本函数相对于输出的导数仅为$$ y - y_ {t} $$。这在某些应用中很方便,例如反向传播。
答案 1 :(得分:0)
符号∥v∥仅表示向量v的常用长度函数。来自您引用的online textbook。
在双栏here上查找更多信息。但根据我的理解,你基本上可以将其视为绝对术语。
我不确定为什么会说 2n ,但它并不总是 2n 。例如,Wikipedia按如下方式编写函数:
谷歌搜索Mean Squared Error也有很多使用维基百科的来源,而不是来自在线教科书的知识。
答案 2 :(得分:0)
双杠是距离度量,如果y是多维的,括号是不正确的。 对于均方误差,n 中没有 2,但这并不重要。它将被学习率吸收。 然而,在求导数时经常需要取消平方数 2。