我想知道使UNet模型在不同输入分辨率下工作的最简单方法是什么?我的意思是,如果我下采样3次,则使用一张320x320尺寸的图像,要素图层的空间尺寸将为:
320 -> 160 -> 80 -> 40 -> 80 -> 160 -> 320
另一方面,如果我输入一张尺寸为960x540的图片,那么我会得到
540 -> 270 -> 135(!) -> 68 -> 136(!) ->...
网络会用这样的输入图像炸毁,因为从跳过连接张量时,张量大小不匹配。
有一些标准的技巧可以处理吗?