我正在使用google speech-api Sbire。这个api有一些我不喜欢的东西。
首先,这不是流媒体模式。它接收小音频文件,但没有真正的管道。 其次,它并不准确。谷歌没有录制我们的声音来学习我们的口音。我认为获得高质量的认可非常重要。
我正在寻找免费的api或开源工具。
答案 0 :(得分:4)
实际上有一种流模式,但它需要一个API密钥。以下是如何使用它的示例:http://mikepultz.com/2013/07/google-speech-api-full-duplex-php-version/
如果你想要学习的东西,你需要创建一个神经网络来处理数据。然而,最好的开源工具是CMUSphinx或pocketSphinx(CMUSphinx的迷你版)。以下是该工具的链接:http://sourceforge.net/p/cmusphinx/code/HEAD/tree/trunk/
然而,CMU-Sphinx的最佳部分是您可以设置关键字词典。你可以让它只输出那些命令,而不是输出乱码,并找到最接近它认为你所说的命令。这使得语音识别非常准确,但只适用于一小部分单词。