我正在为Google Glass编写游戏,但遗憾的是,在Google Glass GDK上的当前版本中无法使用SpeechRecognizer API。
因此,我一直在考虑实施一种非常简单的语音识别算法。
让我们说我只想承认:"是"和"不"。
你知道任何示例代码或任何有用的资源来帮助我实现这个吗?
我是不是应该放弃这个想法并使用像CMUSphinx这样的大框架?
如何识别:上,下,右,左或数字从1到10?
答案 0 :(得分:6)
据我所知,经常使用fast Fourier transform (FFT)过渡到频域并进行分析。还需要一些用于频率相关的语音词典。
请看这个链接:
CMU Sphinx有java实现。
David Wagner有一篇很好的文章和matlab实现。
P.S。哦,如果你用俄语发言,为什么你不读this文章 - 非常简单,用java例子。
P.P.S。老实说,我从不使用这个框架,但如果你只有语言识别的表面知识,那么健壮且最简单的方法是使用现有的完整解决方案,如框架或库,否则你需要花时间来拥有必要的知识阈值。在这种情况下,您可以阅读this文章。