多通道卷积梯度计算的推广

时间:2017-09-02 08:34:42

标签: machine-learning neural-network computer-vision deep-learning conv-neural-network

我一直在努力了解如何在数学水平上实施反网络的反向传播。我找到了this文章,该文章以图形方式解释了2D卷积的梯度计算。 conv layer consists of 3x3 inputsfilter used is 2x2的维度,在卷积results in 2x2 layer上,然后完全连接。此完全关联图层的The gradient将为维度2x2。 根据文章: -

Gradient of conv layer = convolution between gradient of next layer 
and weights of this layer

但我无法对3通道输入进行概括。 让我们说输入图层是维度3x3x3,我们使用1个维度2x2x3的过滤器,然后生成的卷积将再次具有维度2x2,然后将其视为完全连接的图层。 现在是gradient for fully connected layer will be 2x2。因此,为了计算转换层的梯度,我们再次计算convolution between 2x2 gradient layer and 2x2x3 weight layer but they are incompatible

所以,我不明白如何使用这个公式计算3D卷积的梯度。如何在此步骤后继续进行?

关于3D输入的推导(或文章)也将非常有用。

0 个答案:

没有答案