三重损失训练:摘要直方图张量流中的Nan

时间:2020-01-30 13:20:07

标签: python tensorflow conv-neural-network

我正在尝试使用三重态损失训练CNN模型。我有8类(产品)的图像,每个类都有大约100张图像
网络架构如下:

input image   ->          conv1   ->   conv2    ->   conv3   ->   conv4   -> conv5 -> 28D embedding
 182x182     filters       7x7         5x5            3x3          1x1        1x1
             num_outputs    32          64            128          256         28
             activation     Relu       Relu           Relu         Relu       Relu

因此,网络提供了28维嵌入。 但是,在训练过程中,它在随机迭代步骤中抛出以下错误:

tensorflow.python.framework.errors_impl.InvalidArgumentError: Nan in summary histogram for: conv2/weights_1

我已经尝试了一些超参数,但是仍然没有运气,只有迭代步骤 引发错误的位置正在改变。下面是超参数,我正在尝试:

batch size : varied if from 2 to 12
learning rate : 0.001 - 0.002
momentum: 0.9 (since batch size is small)
training iter: 2000 (it is never reaching that, before only throws an error)

任何输入都会很有帮助。

1 个答案:

答案 0 :(得分:0)

我使用更大的批量解决了该问题。当批次中没有三胞胎时,将发生错误。