我正在进行人脸检测。我指的是使用 多任务级联卷积网络。因此,他们提到他们正在使用正像,负像,零件图像和地标图像进行训练。
正片和负片用于人脸分类任务, 正面和零件面用于边界框回归, 和地标面孔用于面部地标定位。
他们随机从WIDER裁剪了几个补丁 面对收集正面,负面和部分面孔。然后, 他们将CelebA的面孔裁剪为具有里程碑意义的面孔。
所以我的问题是,对于CelebA的地标脸,我们有5个地标,但是来自WIDER FACE的正面和部分脸部我们没有地标,因此在训练时,我们如何为此定义基本事实?