我正在开发一个手势识别项目。我的目标是网络摄像头捕获我的手势并将其与我数据库中现有的手势相匹配。我已经能够捕获手势并将它们存储在我的项目文件夹中。现在,我如何比较它们?我对这一部分一无所知。我已经浏览了很多youtube链接,其中大多数只是告诉它们它是如何工作的,它们都没有解释它们使用了什么算法。我完全陷入困境,我想要的只是一些想法或任何可能的链接,可以帮助我理解这个匹配的部分。感谢
答案 0 :(得分:0)
您可以在此处遵循许多不同的方法。
如果您的图像质量很好,那么您可以检测输入图像中的特征点,然后将它们与类似手势的“先前/模板”表示相匹配。这将是一次蛮力搜索。在这里,您可以使用SIFT检测关键点并为每个图像生成描述符,然后根据BFMatcher或FLANN进行匹配。以上所有都是在OpenCV中实现的。只需阅读文档。
文档:detect/match
另一方面,你可以使用Bag-Of-Words方法。这种方法的一个很好的入门在这里:BoW
答案 1 :(得分:-1)
您可以使用分类机器学习算法,例如logistic regression
该算法尝试最小化成本函数以预测图片输入与所有类别(在您的情况下的所有手势)的相似性,并且它将选择最相似的类并给予您。对于图片,您应该将每个像素用作数据的特征
在为您的算法提供足够的训练集后,它可以将您的图片分类为其中一个手势,正如您所说,您正在使用网络摄像头图像,运行时间不会那么多。
以下是斯坦福大学Andrew Ng教授对学习逻辑回归的一个很好的video。