The caffe.io.load_image()
function call on a png, returns a numpy 3d array, with the rgb values as normalized floats in the 0-1 range instead of 0-255.
Is this:
Thanks
答案 0 :(得分:1)
不仅在深度学习中,而且在图像处理/计算机视觉的其他领域,都将像素值标准化为[0..1]
(而不是[0..255]
)范围是常见的做法。
这样做主要是因为原生uint8
像素值不易使用-uint8
容易上浮/下浮。因此,将像素值转换为float
范围内的[0..1]
类型更为方便。
试图应对深层网络中消失/爆炸的梯度,有许多理论论文分析了激活值的分布(例如,见this work)。这些工作通常假定值呈正态分布-因此按比例缩放。您还将遇到许多网络,这些网络除了缩放网络外,还从输入中减去“图像均值”。