我们是否可以裁剪输入激活以匹配ResNet论文中提到的输出尺寸

时间:2016-10-30 12:49:43

标签: python numpy tensorflow torch resnet

我试图在numpy的python中从头开始实现Resnet。虽然单个层工作完美。我目前卡在conv2_3和conv3_1层之间,其中conv3_1层与1x1,128过滤器下行采样56x56到28x28的输入,步幅为2.我目前正在构建152层第一层

ResNet Architecture

我无法弄清楚的部分是我应用这个表达式

output_width = (input_width - filter_width + (2 * pad) ) / stride + 1

在这种情况下,结果是(56-1 +(2 * 0))/ 2 + 1 = 28.5,这比所需尺寸大。我感觉唯一的出路是裁剪输入图像(激活图),我不确定,因为这可能导致图像信息耗尽。知道像tensorflow,caffe,torch这样的其他库如何做到这一点?

0 个答案:

没有答案