android - Google语音识别库或API

Google语音识别库或API

时间：2013-03-22 23:29:51

标签： android google-chrome speech-recognition chromium

谷歌最近在语音识别软件方面取得了很大进展，该软件用于多种开源产品，例如： Chromium Web Speech和Android免提发短信。我想将他们的语音识别作为我的服务器堆栈的一部分，但是我找不到它。

文本识别软件是否可用作库或包？或者，我可以从其他程序调用chrome来将某些音频文件转录为文本吗？

2 个答案:

答案 0 :(得分：1)

Web Speech API仅适用于Chrome或Android环境。客户端中有很多工作要做，因此没有公共服务器到服务器API，只需要一个音频文件并对其进行处理。

如果你搜索github，你会发现https://gist.github.com/alotaiba/1730160等工具，但我很确定这种访问方法是100％不受支持，认可或确认继续工作。

答案 1 :(得分：1)

前面https://gist.github.com/alotaiba/1730160所述的方法对我有用。我每天都在家庭自动化程序中使用它。我使用python脚本捕获音频并确定什么是有用的音频或只是噪音，然后它将小音频片段发送到谷歌并返回文本一秒钟内！我已经成功地将它整合到我的程序中，如果你在谷歌周围，你会发现更多的人也有这个！