我有一个由图像组成的数据集,这些图像具有可以检测到的某些感兴趣的对象。它是像素分类问题,类似于图像分割。我已经注释了每个图像以创建相应的蒙版。 我根据对象的大小为图像中的对象提供了2个类。 因此,我的输入将是MxNx1图像,输出将是MxNx2图像。 输出图像的每个通道在背景像素位置中具有0,并且在包含感兴趣对象的像素位置中具有1。 关于要选择的损失函数我很困惑。我知道,分类交叉熵应该可以解决问题,但我不确定如何修改大小为MxNx2的输出张量,因为传统上损失函数适用于1维张量。
我有两个问题:
如上所述的大小为MxNx2的输出张量,或者大小为MxNx1的输出张量,其中背景像素表示0,1类对象表示1和2类对象表示2.以上哪个适合于实施损失函数?
基于对问题1的回答的损失函数修改。