如何实现可变长度选择的softmax损失

时间:2018-05-16 10:53:51

标签: python tensorflow sequences

我试图在tensorflow上实现drqa模型,我将预测答案子字符串的开始和结束位置。因此,存在[batch_size,max_time]概率输出,相应的上下文序列。现在我想应用softmax交叉enthropy损失,但序列是零填充。因此,我不希望填充计入损失。有一些建议如何实现这个?谢谢。

1 个答案:

答案 0 :(得分:0)

使用重量。

tf.losses.softmax_cross_entropy(
  labels,
  logits,
  weights=[1.]* actual_length + [0.]* (max_length - actual_length)
)