我无法找到内置的张量流,允许您传入不等于1的标签,因此尝试编写自己的:(输入为[batch_size,labels])
tf.reduce_mean(tf.reduce_sum(y_true,axis=1) * tf.reduce_logsumexp(y_pred_logits,axis=1)
- tf.reduce_sum(y_true * y_pred_logits,axis=1))
然而它似乎并没有起作用(损失是分歧的)。我做错了吗?
答案 0 :(得分:0)
我认为这是正确的,但我设置了" epsilon"亚当优化器太低了。