我对损失函数的输出有些困惑。在某些地方,我已经看到损失函数返回标量张量,而在其他地方,我看到它们返回矢量张量,其元素数量等于批处理大小。
均方误差函数是:
def mean_squared_error(y_true, y_pred):
return K.mean(K.square(y_pred - y_true), axis=-1)
因此,它为训练批次中的每个样本返回y_true和y_pred之间的均方误差损失。但是它不应该返回整个批次的总和/平均值吗?
如果我们改用它,那有什么不同?
def mean_squared_error(y_true, y_pred):
return K.mean(K.square(y_pred - y_true))
输出所有批次中所有样本的平均值