我正在尝试从头开始实现卷积神经网络。问题是我不了解如何在CNN中学习过滤器。
我以前从零开始实现了前馈神经网络,并且了解反向传播对它们的工作原理。我也了解基本的CNN架构。但是如何计算更新的过滤器?
我不想使用像tensorflow这样的库,因为我想了解所有这些背后的概念。
答案 0 :(得分:0)
通过CNN进行的反向传播基本上与通过前馈层的反向传播相同。您可以将CNN想象成一个滑动窗口,在输入的每个窗口上应用相同的前馈层。 (您只需获取窗口中的所有值,然后将它们排列在单个长向量中即可。)
您可以为每个窗口独立计算参数的梯度。因为您在每个窗口中应用了相同的参数,所以可以对每个窗口中的梯度求和,并使用梯度进行更新,并使用它们来更新过滤器的参数。
P.S。自己编写反向传播可能是一个很好的练习,但是您几乎无法达到框架的效率。