我正在使用类似vgg的卷积神经网络进行像素分类。
我使用的数据的格式为WxHxC(C=300)
。实际上,我想要的结果是预测哪个像素属于哪个类别。因此,我将数据调整为(W*H,1,C)
并沿通道方向执行1d卷积。与基本事实相比,使用Crossentropyloss。理想的输出也应该是基本原则。
但是我还有其他东西。
例如,我想要的理想结果应该像第一张图片https://i.stack.imgur.com/BZlUr.png。但是我得到了图像2 https://i.stack.imgur.com/BZlUr.png的纹理信息图片。 (对不起,使用他人的照片)
这种结果有什么问题?还是类似vgg的网络无法进行此类分类?这种工作需要up-Conv(例如Unet或FCN)吗?
我现在有点困惑。