标签: keras tensorflow2.0 loss-function keras-2
我在使用
sample_weight_mode =“ temporal”
,其中输入样本和预测都是时间上的。现在有些情况下,我根本不希望损失对某些样本进行反向传播,因此对于这些特定样本的所有时间步长,我都将sample_weight提供为零的向量。奇怪的是,在这些情况下,损失为NaN而不是零!为什么会这样?我还认为Keras不能对sample_weight数组进行归一化,因为缩放也会缩放损失。