有限数量命令的快速语音识别

时间:2014-01-18 23:54:49

标签: c++ windows voice-recognition

是否有人在C ++(Windows和/或Mac)中编写语音识别编程,以获得针对SPEED的有限数量的命令?在这一点上实现从第一个音节识别命令是否现实 - 即,命令是通过用户以合理快速的节奏到达第二个音节的时间来识别的?所有命令都将被编程为以不同的音节开始,如果需要,一个完全不同的音节(如“oo”,“xy”,“fay” - 只需要30个命令)。 已经提出了类似的问题,但这是一个快速发展的领域。最好的想法是寻找开源库还是与已编译的实现接口?

2 个答案:

答案 0 :(得分:1)

我在这个领域工作专业,我很怀疑它是否有可能。 C ++不是问题,问题是计算机是否允许它。小声音片段的错误率很大,它是固定识别的隐马尔可夫模型。但在你的情况下,你根本无法提供足够的数据。

不是人类也可以做到这一点。语音处理并不像你的大脑让你相信的那么快。

答案 1 :(得分:0)

您可以使用Pocketsphinx解码器CMUSphinx执行此操作。

解码的部分假设在识别过程中是可用的,你通常可以在发出声音后立即获得第一个音节。如果给它0.1s来稳定(对用户不可见),你将在命令集上得到准确的结果。

在CMUSphinx的顶部甚至还有专为实时控制而设计的工具,例如在游戏中,您可以查看InProTK及其演示。