标签: image computer-vision deep-learning
我见过很多比较两个图像并使用CNN计算相似度的方法。但似乎这些方法并没有反映出图像中的背景。那么如果有一个生成良好的图像描述(标题)并将其用作图像相似度的新度量,你认为图像相似性的方法/度量会更好吗?
使用CNN计算图像相似性有哪些局限性? 谢谢。