我正在尝试使用三重态损失训练CNN模型。我有8类(产品)的图像,每个类都有大约100张图像
网络架构如下:
input image -> conv1 -> conv2 -> conv3 -> conv4 -> conv5 -> 28D embedding
182x182 filters 7x7 5x5 3x3 1x1 1x1
num_outputs 32 64 128 256 28
activation Relu Relu Relu Relu Relu
因此,网络提供了28维嵌入。 但是,在训练过程中,它在随机迭代步骤中抛出以下错误:
tensorflow.python.framework.errors_impl.InvalidArgumentError: Nan in summary histogram for: conv2/weights_1
我已经尝试了一些超参数,但是仍然没有运气,只有迭代步骤 引发错误的位置正在改变。下面是超参数,我正在尝试:
batch size : varied if from 2 to 12
learning rate : 0.001 - 0.002
momentum: 0.9 (since batch size is small)
training iter: 2000 (it is never reaching that, before only throws an error)
任何输入都会很有帮助。
答案 0 :(得分:0)
我使用更大的批量解决了该问题。当批次中没有三胞胎时,将发生错误。