应用错误收集

时间：2014-02-27 03:07:21

标签： speech-recognition

我知道音频指纹识别音频文件非常棒，但我真正想知道的是Google如何制作语音识别API，他们是如何获取音频和返回文字的。

我写了一个宝石来指纹wav音频文件并进行比较，但如果我使用指纹将我的声音与充满指纹的数据库进行比较，那么它可能会花费很长时间。谷歌如何做到这一点？

目的：

我真的很喜欢语音识别，我想要一个地方开始编码，但我不知道从哪里开始。 DragonVoice是语音识别软件的另一个例子，所有这些软件都非常快。

我想知道服务器流来自获取音频记录以将其转换为文本。

答案 0 :(得分：3)

使用来源，Luke： - ）

最佳的开源语音识别软件（imho）：CMUSphinx http://cmusphinx.sourceforge.net/

学习曲线有点陡峭，但它应该值得...

FWIW，Stackoverflow上标签语音识别的描述说：语音识别是指识别谈话的人，并经常误用“语音识别” - 识别所说的内容。

如上所述，这是一个非常常见的错误： - ）

玩得开心！