应用错误收集

有限数量命令的快速语音识别

时间：2014-01-18 23:54:49

标签： c++ windows voice-recognition

是否有人在C ++（Windows和/或Mac）中编写语音识别编程，以获得针对SPEED的有限数量的命令？在这一点上实现从第一个音节识别命令是否现实 - 即，命令是通过用户以合理快速的节奏到达第二个音节的时间来识别的？所有命令都将被编程为以不同的音节开始，如果需要，一个完全不同的音节（如“oo”，“xy”，“fay” - 只需要30个命令）。已经提出了类似的问题，但这是一个快速发展的领域。最好的想法是寻找开源库还是与已编译的实现接口？

2 个答案:

答案 0 :(得分：1)

我在这个领域工作专业，我很怀疑它是否有可能。 C ++不是问题，问题是计算机是否允许它。小声音片段的错误率很大，它是固定识别的隐马尔可夫模型。但在你的情况下，你根本无法提供足够的数据。

不是人类也可以做到这一点。语音处理并不像你的大脑让你相信的那么快。

答案 1 :(得分：0)

您可以使用Pocketsphinx解码器CMUSphinx执行此操作。

解码的部分假设在识别过程中是可用的，你通常可以在发出声音后立即获得第一个音节。如果给它0.1s来稳定（对用户不可见），你将在命令集上得到准确的结果。

在CMUSphinx的顶部甚至还有专为实时控制而设计的工具，例如在游戏中，您可以查看InProTK及其演示。