成功识别图像的步骤

时间:2013-07-22 18:29:03

标签: image-processing machine-learning

我已经做了几周的图像处理和机器学习课程。每天我都会学到一些关于图像处理的新知识,以及如何训练系统识别图像中的图案。 我的问题是为了成功识别图像,必须遵循的步骤是什么,例如去噪,使用LDA,PCA,然后使用神经网络。我不是在寻找任何算法,只是从捕获图像到测试输入图像的相似性的每个步骤(5 -6)的简要概述。

P.S#对于mods,在将这个问题标记为不具有建设性之前,我知道它不具有建设性,但我不知道将这个问题放在哪个网站上。所以请重新定向我的stackexchange站点。

感谢。

3 个答案:

答案 0 :(得分:3)

我将如下描述管道,并省略了许多项目。

  1. 获取具有地面真实标签的图像。
    • 亚马逊M-turk
    • 来自flickr的图片和标签
  2. 计算该图片的功能
    • 将图像直接拉伸为列向量
    • 使用更复杂的功能,如文字袋,LBP。
  3. 后处理功能以在需要时减少噪音的影响
    • 稀疏编码
    • max pooling
    • 增白
  4. 根据(特征,标签)对训练分类器/回归器
    • SVM
    • 升压
    • 神经网络
    • 随意森林
    • 谱聚类
    • 启发式方法......
  5. 使用经过训练的模型识别看不见的图像,并使用一些指标评估结果。
  6. 顺便说一句。传统上,我们将使用降维方法(如PCA)来使问题易于处理,但最近的研究似乎并不关心。

答案 1 :(得分:2)

几个月前,我开发了一个使用局部二进制模式的人脸识别系统。 在这种方法中,我首先从本地存储或相机拍摄图像,然后使用局部二进制模式方法我考虑输入图像的每个块。获得输入图像的LBP后,我找到了lbp特征直方图的卡方距离。使用相同的过程将其值与存储的数据库映像进行比较。我能够得到同样的面孔。

答案 2 :(得分:1)

亚马逊M-turk是一项让人们为您服务的服务。 (你付钱给他们)

SIFT是兴趣点的描述符。通过比较这些描述符,您可以找到图像之间的对应关系。 (SIFT符合第2步。)

在执行第4步时,您可以选择合并不同分类器的结果,或者只是信任一个分类器的结果。这取决于具体情况。

您是否要标记受影响地区的位置?我不确定你要做什么。

无法使用评论,所以我发布了另一个答案。