我目前正致力于手语识别应用程序,我希望使用隐马尔可夫模型作为分类阶段,这意味着我将对手势/姿势进行分类以获得相关的字母或单词。
我目前已经完成了第一阶段的检测。目前,我可以获得一些参数(功能),我可以将其用于我的机器学习阶段,例如:
这些都可以通过openCv来完成。
我的问题:一旦掌握了所有这些功能,我该如何执行“特征提取”阶段?即如果是机器学习算法,在这种情况下HMM需要一组概率,我该如何使用上述信息呢?
我的一个想法是创建一个特殊的数据结构,其中包含唯一标识每个手势的信息,但我如何将其提供给机器学习技术? (在这种情况下是隐马尔可夫模型)
任何人都可以指导我至少在这个特定阶段应该搜索的内容,或者指导我展示实际上我真正遇到的困难吗?
答案 0 :(得分:4)
准备完一组观测结果后,可以将其提供给维特比算法,以检测可能产生这些观测结果的最佳状态序列。此外,您可以使用Baum-Welch算法在样本数据集上训练HMM。您可以查看my blog post,这是使用HMM识别动态手势的简单解释(尽管我不使用openCV或扫描手的轮廓)。希望这可以帮助您全面了解处理和学习阶段。