我一直在努力了解如何在数学水平上实施反网络的反向传播。我找到了this文章,该文章以图形方式解释了2D卷积的梯度计算。 conv layer consists of 3x3 inputs
和filter used is 2x2
的维度,在卷积results in 2x2 layer
上,然后完全连接。此完全关联图层的The gradient
将为维度2x2
。
根据文章: -
Gradient of conv layer = convolution between gradient of next layer
and weights of this layer
但我无法对3通道输入进行概括。
让我们说输入图层是维度3x3x3
,我们使用1个维度2x2x3
的过滤器,然后生成的卷积将再次具有维度2x2
,然后将其视为完全连接的图层。
现在是gradient for fully connected layer will be 2x2
。因此,为了计算转换层的梯度,我们再次计算convolution between 2x2 gradient layer and 2x2x3 weight layer but they are incompatible
。
所以,我不明白如何使用这个公式计算3D卷积的梯度。如何在此步骤后继续进行?
关于3D输入的推导(或文章)也将非常有用。