张量流图像运算符所期望的RGB格式是什么?

时间:2017-07-05 23:59:26

标签: image input tensorflow

张量流图像op(如nn.conv2d)如何表示图像通道?

  1. 3个值的数组,范围为[0-255]
  2. 3个值的数组,范围从[0-1]
  3. 3个大小为255的单热阵列的数组
  4. 别的什么?
  5. 我试图理解为什么我的学习率如此之差,我猜测它是因为我的输入结果不正确。

1 个答案:

答案 0 :(得分:1)

conv2d接受您在此提及的所有表单。它并不关心输入范围应该是什么,只要它在数据类型范围内。但是从神经网络训练的角度来看,输入正确缩放非常重要。不仅对输入图像,甚至在每个层级我们都希望输入正确缩放。这就是为什么像batch-normalization这样的技术几乎在所有最近的网络中都存在的原因,因为它通过网络实现更好的梯度流来改善训练。因此,将图像缩放到[-1,+ 1]范围(或零均值单位方差)非常重要。