我的模型在每个纪元后都有https://www.googleapis.com/youtube/v3/videos?part=snippet&id=zzzz&key=xxxxxx
输入和N
输出。
我的输出看起来像6
,我想最小化每个术语的MSE。但是,我注意到当我使用MSE作为损失函数时,它只是取整个集合的平方和的平均值。
答案 0 :(得分:1)
您必须创建一个等于MSE的张量并将其最小化。
mse = tf.reduce_mean(tf.square(outputs))
train_step = tf.train.*Optimizer(...).minimize(mse)
for _ in range(iterations):
sess.run(train_step ... )
答案 1 :(得分:1)
我认为他们的意思都是一样的。让我们用i^th
表示您对[x_i, y_i, z_i, xx_i, yy_i, zz_i]
样本的预测。真值由[t_x_i, t_y_i, t_z_i, t_xx_i, t_yy_i, t_zz_i]
在一批N
个样本中,您希望最小化:
L = \sum_i=1^N ((x_i-t_x_i)^2)/N + ... + \sum_i=1^N ((zz_i-t_zz_i)^2)/N
MSE损失将使以下内容最小化:
L = (1/N) * \sum_i=1^N ((1/6) * [(x_i - t_x_i)^2 + ... + (zz_i-t_zz_i)^2])
你可以看到两者最终都会减少相同的数量。
我认为,如果您的六个输出是自变量,我认为它们是正确的,因为您将它们建模为具有六个基本事实标签的六个不同输出。