应用错误收集

时间：2013-12-05 01:22:26

标签： open-source speech-recognition speech-to-text

我正在使用google speech-api Sbire。这个api有一些我不喜欢的东西。

首先，这不是流媒体模式。它接收小音频文件，但没有真正的管道。其次，它并不准确。谷歌没有录制我们的声音来学习我们的口音。我认为获得高质量的认可非常重要。

我正在寻找免费的api或开源工具。

答案 0 :(得分：4)

实际上有一种流模式，但它需要一个API密钥。以下是如何使用它的示例：http://mikepultz.com/2013/07/google-speech-api-full-duplex-php-version/

如果你想要学习的东西，你需要创建一个神经网络来处理数据。然而，最好的开源工具是CMUSphinx或pocketSphinx（CMUSphinx的迷你版）。以下是该工具的链接：http://sourceforge.net/p/cmusphinx/code/HEAD/tree/trunk/

然而，CMU-Sphinx的最佳部分是您可以设置关键字词典。你可以让它只输出那些命令，而不是输出乱码，并找到最接近它认为你所说的命令。这使得语音识别非常准确，但只适用于一小部分单词。