像ffffound这样的程序是如何构建的?

时间:2013-11-22 11:03:45

标签: machine-learning

程序如何知道彼此的图像是什么?如果没有计算机能够用人眼观察图片,那么你如何编程,让它选择能满足用户口味的好图像?

这是一个关于实施的问题,但我希望它不是太广泛或偏离主题。

1 个答案:

答案 0 :(得分:2)

这是一个广泛的问题。您要查找的关键字是:

  • 图像相似性度量 - 主要基于图像的一些数值表示来测量两个给定图像(或整个集合)之间的相似性的函数的通用名称(在最简单的情况下,图像之间的欧几里德距离被视为多维实值中的点空间)
  • 图像描述符 - 函数的通用名称,对于给定图像构造某种图像表示捕获其最重要的特征。这里有几十个类别,从形状描述符(捕捉某些元素的形状)到一些简单的统计描述符(例如直方图)到一些关键点提取方法(例如SIFT)

所以一般来说,为了衡量,指定某种“形象相似”,你需要两个方面:

  • 图像表示
  • 图像相似性度量(在此表示中定义)

这些元素经常合并在一起,而现在 - 相当于从图像(机器学习,特别是在Hinton意义上的现代深层架构)中学习,然后手工构建(旧日特征工程)。

在机器学习方法中,您只需告诉您的模型,某些给定的图像相似(表示相同的类,相同类型的对象)并使用优化技术搜索这样的参数集,那些最好的东西抓住了这种联想。