最近,我正在研究通过将图像编码为紧凑的二进制描述符的可能方式,这些描述符可以在大型语料库中实现快速图像匹配,并遇到了由Kevin Lin和他的同事撰写的this paper。
在本文中,他们提出了一种无监督的学习方法来学习图像的紧凑二进制描述符。具体来说,他们提出了损失函数来惩罚包含3个成分的描述符:
我的问题在于第一部分。在本文中,损失函数定义为二进制批量与微型批处理中所有训练数据上的最后一层激活之间的平方误差之和。但是,当我执行此操作时,总体损失变得如此之大,以至于其他两个组成部分变得无关紧要,因此根本没有平均分配。
所以我想知道这是否是本文中的错字,应该是平方误差的均值而不是总和。
干杯。