我正在使用Keras制作CNN,我希望用plot_model()
可视化模型。
当我看到Conv2d
图层的形状时,有一件事我无法理解。
假设我的Conv2d
图层的内核大小为[8 x 8]
,步幅为[4 by 4]
,填充为'same'
,我想要16个要素图。
此图层的输入形状为[None, 3, 160, 320]
,输出为[None,1,40,16]
。
'无'是样品,但是1和40是什么?我猜16是特征图的数量?
由于我实现了padding = 'same'
,因此图像大小不应该与输入具有相同的宽度和高度,或者这不是同一个东西吗?
谢谢!
答案 0 :(得分:0)
好吧,既然你正在使用"大步前进,那么你将永远不会有相同的形状。
您的卷积滤镜(可以看作是滑动窗口)在其滑动中跳跃四个像素。
因此,您将最终形状除以4(并向上舍入)。