大量标签的热门编码

时间:2016-06-14 11:14:38

标签: tensorflow deep-learning one-hot-encoding

我对一个问题感到困惑,并希望得到你的意见。我正在研究张量流中的卷积神经网络。现在我有带标签的图像。大约有10000个唯一标签,我希望图像能够自动标记。 现在我使用一个热编码标签。对于10000个唯一标签,它将像功能故障一样。我们如何处理这种情况?

facebook如何在面部标记中执行此操作?有数百万的面孔。我猜他们没有为face标签做一个热编码吗?

1 个答案:

答案 0 :(得分:5)

在面部识别中,处理数百万个课程的标准方法是使用嵌入。 CNN产生的嵌入大小在64到1024之间。

在这个嵌入空间中,每类图像应该形成一组图像,不同类的簇应该相距很远。

Facebook的方法在他们的DeepFace paper(2014年6月)中有所描述,但我建议使用三联体丢失FaceNet: A Unified Embedding for Face Recognition and Clustering来采用Google近期的方法。

triplet loss