我正尝试训练具有两个类别的二进制CNN分类器:具有特定对象(即人脸)的图像和不具有该对象的图像。最后可视化热图(分类激活图)。
我的观察是,具有各种随机背景的“非脸部”图像过于多样化,并且很难训练。例如,我给有脸的图像分配标签“ 1”,给没有脸的图像分配标签“ 0”,在这里我使用Softmax交叉熵损失。在训练期间,Softmax交叉熵损失迅速下降。
Positive class label: 1. ## Random background with faces as foreground
Negative class label: 0. ## Random background (i.e. forest, plane, ocean…) without any faces
我希望突出显示“面部”图像中的面部,但有时其他背景也会被突出显示。我的上述设置可能有什么问题?
一些随机的想法:
(1)我的印象是,如果分类问题有N个类别,则输出神经元的数量应为N + 1……对吗?
(2)我应该在这里使用Softmax交叉熵和一种热编码吗?
(3)我给人的印象是,有时人们将-1用于否定类别,我是否错误将0用于否定类别?