如果你回答我的问题,我将感激不尽。我担心我做错了,因为我的网络总是提供黑色图像而没有任何分割。
我正在Caffe
进行语义分割。 score layer
的输出是< 1 5 256 256> batch_size no_classes image_width image_height
。哪个发送到SoftmaxWithLoss
图层,丢失图层的输出输出是具有5个类别标签< 1 1 256 256>的groundtruth图像。
我的问题是:损失层的这两个输入的维度不匹配。我应该为这5个类创建5个标签图像,并将标签层中的batch_size 5发送到损失层吗?
如何为语义分段准备标签数据?
此致
答案 0 :(得分:0)
你的尺寸还可以。你输出每像素5个向量表示每个类的概率。基本事实是单个标签(整数),并且损失鼓励正确标签成为像素的最大值的概率