我想自己实现tf.nn.sparse_softmax_cross_entropy。但经过一些批次,损失变成了纳米!
有我的代码:
logits_batch_size = tf.shape(logits)[0]
labels = tf.reshape(tgt_seq, [-1])
eps = tf.fill(tf.shape(logits), 1e-8)
logits = logits + eps
labels_1 = tf.expand_dims(labels, 1)
index = tf.expand_dims(tf.range(0, logits_batch_size), 1)
concated = tf.concat([index, labels_1], 1)
onehot_labels = tf.sparse_to_dense(concated, tf.stack([logits_batch_size, tvsize]), 1.0, 0.0)
y_log = tf.log(tf.nn.softmax(logits))
cost = tf.reduce_mean(-tf.reduce_sum(tf.multiply(onehot_labels, y_log), 0))
logits与tf.nn.sparse_softmax_cross_entropy中的logits相同,2-D张量,tgt_seq也是2-D张量。我的任务是序列到序列学习任务。
任何人都可以帮助我吗?