u-net的输入图像尺寸为572 * 572,但输出掩模尺寸为388 * 388。如何用较小的掩模掩盖图像?
答案 0 :(得分:1)
可能你指的是Ronneberger等人发布的U-Net架构的scientific paper。图中显示了这些数字。
在" 3部分中有点隐藏了解释。训练强>"论文:
由于未填充卷积,输出图像比输入的边界宽度小。
这意味着在每次卷积过程中,部分图像被裁剪为#34;因为卷积将以坐标开始,因此它与图层的输入图像/输入blob完全重叠。在3x3卷积的情况下,每侧总是一个像素。有关内核/卷积的可视化解释,请参阅例如here。 输出较小,因为由于在非填充卷积期间发生裁剪,仅图像(内部)部分得到结果。
这不是架构的一般特征,而是(无衬垫)卷积固有的东西,可以通过填充来避免。可能最常见的策略是在图像边界处镜像,以便每个卷积可以从图像的最边缘开始(并且在其内核重叠的地方看到镜像像素)。然后可以保留输入大小,并对整个图像进行分段。