我试图在tensorflow上实现drqa模型,我将预测答案子字符串的开始和结束位置。因此,存在[batch_size,max_time]概率输出,相应的上下文序列。现在我想应用softmax交叉enthropy损失,但序列是零填充。因此,我不希望填充计入损失。有一些建议如何实现这个?谢谢。
答案 0 :(得分:0)
使用重量。
tf.losses.softmax_cross_entropy(
labels,
logits,
weights=[1.]* actual_length + [0.]* (max_length - actual_length)
)