如上所述,两者
tf.nn.conv2d,strides = 2
和
tf.nn.max_pool with 2x2 pooling
可以将输入的大小减少到一半,我知道输出可能会有所不同,但我不知道的是,影响最终的训练结果与否,任何关于此的线索,谢谢。
答案 0 :(得分:2)
在两个示例中,我们假设我们有一个[height, width]
内核应用了strides [2,2]
。这意味着我们将内核应用于2-D输入上的大小为[height, width]
的2-D窗口以获得输出值,然后向上或向下滑动窗口2以获得下一个输出值。
在这两种情况下,假设padding='SAME'
不同之处在于如何为每个窗口计算输出值:
<强> conv2d 强>
[height, width]
内核中每个单元格的权重<强> max_pool 强>
[height, width]
窗口中选择最大输入值答案 1 :(得分:0)
最终训练的结果可能实际上是不同的,因为卷积将张量乘以滤波器,您可能不想这样做,因为它占用了额外的计算时间,并且还可以过度拟合模型,因为它将具有更多权重。