零中心处理的全球平均值和局部平均值之间的差异是什么?

时间:2018-06-07 01:20:24

标签: machine-learning neural-network deep-learning computer-vision normalization

在图像预处理阶段必须进行零居中。

但我不知道为什么有些论文会减去全球平均值(整个训练集中的平均值),而其他论文只是减去当地平均值(每个小批量的平均值)。你能否解释一下这个想法?

PS :在零中心时,我们是否减去每个频道的平均值?

1 个答案:

答案 0 :(得分:1)

作为预处理步骤的零中心具有各种优势,但是为了清楚这一点,如果您有理由相信不同的输入要素具有不同的比例,则应用此预处理才有意义。 (或单位),但它们应该与学习算法大致相同。在图像的情况下,像素的相对比例已经近似相等(并且在0到255的范围内),因此不必严格地执行该额外的预处理步骤。 Find more Information here

小批量中的标准化通常称为"批量标准化"并且遵循这个想法来解决消失/爆炸的梯度问题以及每个层的输入在训练期间的分布变化作为先前层的参数变化的问题。通过在每层之前进行零居中和规范化,网络学会应对这种"内部协变量转换"。 Find more Information here

PS:作为预处理步骤的零中心可以通过除以标准差来完成,也可以根据您的分布的最小/最大值进行缩放(通常在所有分配上完成渠道 /功能,取决于您的数据以及您是否希望它们对培训产生相同的影响,但可能存在例外情况。)