训练算法以获得更好的图像识别

时间:2012-10-22 20:14:09

标签: machine-learning image-recognition

这是一个研究问题而非直接编程问题。

我正在研究一种符号识别算法,该软件目前的功能是什么,它采用图像,将其划分为轮廓(blob)并开始将每个轮廓与预定义模板列表进行匹配。然后对于每个轮廓,它采用匹配率最高的那个。

算法正在顺利进行,但我需要更好地训练它。我的意思是: 我想使用机器学习算法来训练算法以获得更好的匹配。让我们举个例子:

我在符号上运行识别,算法将运行并发现此符号是汽车,然后我必须确认结果(可能通过点击“是”或“否”)算法应该从中学习。因此,如果我点击否,算法应该知道这不是汽车,并且下次会有更好的结果(也许尝试匹配其他东西)。如果我点击“是”,他就会知道他是正确的,下次他在搜索汽车时表现更好。

这是我想要研究的概念。我需要能够实现这类目标的文档或算法。我不是在寻找实现或编程,只是概念或研究。

我做了很多关于机器学习,神经网络,决策树的研究和阅读......但是我无法知道如何在我的场景中使用任何东西。

我希望我很清楚,这种类型的问题在堆栈溢出时是允许的。如果不是我很抱歉

非常感谢任何帮助或提示

1 个答案:

答案 0 :(得分:5)

图像识别仍然是社区的挑战。您在手动单击是/否的过程中所描述的只是创建标记数据。由于这是一个非常广泛的领域,我将仅指出一些可能有用的链接。

  • 首先,您可能希望使用一些现有的图像数据库,而不是创建自己的图像数据库,这可以节省大量的工作。例如,UCIC image db中的这个汽车数据集。

  • 由于您已具备机器学习的背景,因此您可以查看一些与您的项目兴趣完全匹配的调查文件,例如,在Google中搜索object recognition survey paperfeature extraction car。 / p>

  • 然后你可以深入研究一些好的论文,看看它们是否适合你的项目。例如,您可以查看下面与UCIC图像数据库链接的两篇论文。

    • Shivani Agarwal,Aatif Awan和Dan Roth, 学习通过稀疏的,基于部分的表示来检测图像中的对象。 IEEE Transactions on Pattern Analysis and Machine Intelligence,26(11):1475-1490,2004。
    • Shivani Agarwal和Dan Roth, 学习用于对象检测的稀疏表示。 “第七届欧洲计算机视觉会议论文集”,第四部分,第113-130页,丹麦哥本哈根,2002年。
  • 同时检查一些已实施的软件,而不是从头开始,在您的情况下,opencv应该是一个好的开始。

  • 对于图像识别,特征提取是最重要的一步。您可能想要检查社区中的一些最先进的算法。 (SIFT,均值漂移,harr特征等)。

  • 当您到达分类步骤时,Boosting算法也可能很有用。我看到很多学者在图像识别界提到这一点。

  • 正如@nickbar建议的那样,请在https://stats.stackexchange.com/

  • 讨论更多内容