我试图在numpy的python中从头开始实现Resnet。虽然单个层工作完美。我目前卡在conv2_3和conv3_1层之间,其中conv3_1层与1x1,128过滤器下行采样56x56到28x28的输入,步幅为2.我目前正在构建152层第一层
我无法弄清楚的部分是我应用这个表达式
output_width = (input_width - filter_width + (2 * pad) ) / stride + 1
在这种情况下,结果是(56-1 +(2 * 0))/ 2 + 1 = 28.5,这比所需尺寸大。我感觉唯一的出路是裁剪输入图像(激活图),我不确定,因为这可能导致图像信息耗尽。知道像tensorflow,caffe,torch这样的其他库如何做到这一点?