使用cnn进行像素级分类,得到错误的结果,为什么?

时间:2019-02-15 08:32:10

标签: conv-neural-network pixel semantic-segmentation

我正在使用类似vgg的卷积神经网络进行像素分类。

我使用的数据的格式为WxHxC(C=300)。实际上,我想要的结果是预测哪个像素属于哪个类别。因此,我将数据调整为(W*H,1,C)并沿通道方向执行1d卷积。与基本事实相比,使用Crossentropyloss。理想的输出也应该是基本原则。 但是我还有其他东西。

例如,我想要的理想结果应该像第一张图片https://i.stack.imgur.com/BZlUr.png。但是我得到了图像2 https://i.stack.imgur.com/BZlUr.png的纹理信息图片。 (对不起,使用他人的照片)

这种结果有什么问题?还是类似vgg的网络无法进行此类分类?这种工作需要up-Conv(例如Unet或FCN)吗?

我现在有点困惑。

0 个答案:

没有答案