我的图片大小为WxHx3
,需要细分为21个班级。在使用CNN通过一些图层后,我获得了W/4 x H/4 x 512
特征图。最后,我们将使用Convolutional
和Deconvolutional
图层将其与softmax
图层中的标签进行比较。我有2种拓扑:
Softmax_loss Softmax_loss
^ ^
| |
deconv_layer conv_layer
^ ^
| |
conv_layer deconv_layer
^ ^
| |
Intermediate_layers Intermediate_layers
^ ^
| |
Input Input
(1) (2)
哪种拓扑更好?我见过他们两个。 FCN
中的第1位(用于语义分割的完全卷积网络),VoxResNet
中的第2位,UNet
。
答案 0 :(得分:3)
深度学习没有正确的方法。你经常尝试一些最适合自己的东西。如果您关注fcn
模型,则会像conv->deconv->conv->deconv
一样启动。语义分割中引用的大多数论文都是conv->deconv
。所以我也建议1号。同样直观地说,首先做deconv
并没有多大意义。