有没有比google speech-api更好的解决方案?

时间:2013-12-05 01:22:26

标签: open-source speech-recognition speech-to-text

我正在使用google speech-api Sbire。这个api有一些我不喜欢的东西。

首先,这不是流媒体模式。它接收小音频文件,但没有真正的管道。 其次,它并不准确。谷歌没有录制我们的声音来学习我们的口音。我认为获得高质量的认可非常重要。

我正在寻找免费的api或开源工具。

1 个答案:

答案 0 :(得分:4)

实际上有一种流模式,但它需要一个API密钥。以下是如何使用它的示例:http://mikepultz.com/2013/07/google-speech-api-full-duplex-php-version/

如果你想要学习的东西,你需要创建一个神经网络来处理数据。然而,最好的开源工具是CMUSphinx或pocketSphinx(CMUSphinx的迷你版)。以下是该工具的链接:http://sourceforge.net/p/cmusphinx/code/HEAD/tree/trunk/

然而,CMU-Sphinx的最佳部分是您可以设置关键字词典。你可以让它只输出那些命令,而不是输出乱码,并找到最接近它认为你所说的命令。这使得语音识别非常准确,但只适用于一小部分单词。