匹配来自一组图像的图像:结合传统的计算机视觉+深度学习/ CNN

时间:2017-10-23 15:27:27

标签: opencv image-processing neural-network computer-vision deep-learning

在我正在开发的应用程序中,我有大约5000个产品标签图像。(每个产品一个标签)。

我的应用程序的一个功能是用户可以使用他的相机拍照并获得与系统注册的产品标签的匹配。

从最初开始,我的系统每个产品只有一个样本,我决定采用传统的计算机视觉技术。我设法使用特征提取和描述符匹配来实现这一点。(使用OpenCV SIFT和FLANN技术参考:https://github.com/kipr/opencv/blob/master/samples/cpp/matching_to_many_images.cpp

现在我正在考虑如何通过结合CNN或深度学习技术来提高准确性,因为当用户批准匹配时,它会逐渐为产品添加更多标签样本。

是否有可能建立一个结合计算机视觉技术和CNN /深度学习技术的混合图像匹配系统?

是否有任何类似的服务已作为服务提供?

1 个答案:

答案 0 :(得分:2)

您应该了解有关距离度量学习(DML)的更多信息。互联网上有很多信息,但简要说明一下:

  1. 您必须为您的基础中的每个图像获取嵌入(矢量表示)(例如,从现代CNN之一(Inception,VGG,ResNet,DenseNet)的最后一个卷积层获取特征向量)
  2. 然后,当你得到新的图像时,你应该创建当前图像的矢量表示,并找到距你的基点最近的矢量(例如,按欧几里德距离)
  3. 这个话题很复杂,所以仔细研究:) 祝你好运!