应用错误收集

我试图在numpy的python中从头开始实现Resnet。虽然单个层工作完美。我目前卡在conv2_3和conv3_1层之间，其中conv3_1层与1x1,128过滤器下行采样56x56到28x28的输入，步幅为2.我目前正在构建152层第一层

我无法弄清楚的部分是我应用这个表达式

output_width = (input_width - filter_width + (2 * pad) ) / stride + 1

在这种情况下，结果是（56-1 +（2 * 0））/ 2 + 1 = 28.5，这比所需尺寸大。我感觉唯一的出路是裁剪输入图像（激活图），我不确定，因为这可能导致图像信息耗尽。知道像tensorflow，caffe，torch这样的其他库如何做到这一点？