前言,我是ML / CV领域的新手,目前正在使用Caffe培训自定义转发网络。
我对平均图像减法感兴趣,以便在我的训练图像上实现基本的数据标准化。但是,我对于减法的有效性以及它有什么好处感到困惑。
我知道可以从训练集中计算“平均图像”,然后从训练集,验证集和测试集中减去该平均图像,以使网络对不同的背景和闪电条件不那么敏感。
这是否涉及计算每幅图像中所有像素的平均值,并对这些像素求平均值?或者,来自每个像素坐标的值是否在该组中的所有图像上平均(即,对于所有图像,位置(1,1)处的像素的平均值)?这可能要求所有图像都是相同的大小...
另外,对于彩色图像(3通道),每个通道的值是单独平均的吗?
任何清晰都会受到赞赏。
答案 0 :(得分:7)
在深度学习中,实际上有关于如何减去平均图像的不同实践。
第一种方法是将均值图像减去所描述的@lejlot。但是如果您的数据集图像大小不同,则会出现问题。在使用此方法之前,您需要确保所有数据集图像的大小相同(例如,调整原始图像的大小和从原始图像调整相同大小的裁剪)。它在原始ResNet论文中使用,请参阅reference here。
第二种方法是从原始图像中减去每个通道的平均值,这更受欢迎。这样,您无需调整原始图像的大小或裁剪。您可以从训练集中计算每个通道的平均值。这在深度学习中被广泛使用,例如Caffe:here和here。 Keras:here。 PyTorch:here。 (PyTorch还将每通道值除以标准偏差。)
答案 1 :(得分:4)
平均图像是i,j,c像素是来自所有图像的i,j,c像素的平均值的图像。因此,您可以分别为每个位置和每个颜色通道选择一个平均值。它要求所有图像当然具有相同的大小,否则它没有定义。此外,它并不是真的对不同的条件不那么敏感 - 它与它无关,它实际上只是为了将初始激活保持在合理的范围内,没有别的。