Google语音识别库或API

时间:2013-03-22 23:29:51

标签: android google-chrome speech-recognition chromium

谷歌最近在语音识别软件方面取得了很大进展,该软件用于多种开源产品,例如: Chromium Web Speech和Android免提发短信。我想将他们的语音识别作为我的服务器堆栈的一部分,但是我找不到它。

文本识别软件是否可用作库或包?或者,我可以从其他程序调用chrome来将某些音频文件转录为文本吗?

2 个答案:

答案 0 :(得分:1)

Web Speech API仅适用于Chrome或Android环境。客户端中有很多工作要做,因此没有公共服务器到服务器API,只需要一个音频文件并对其进行处理。

如果你搜索github,你会发现https://gist.github.com/alotaiba/1730160等工具,但我很确定这种访问方法是100%不受支持,认可或确认继续工作。

答案 1 :(得分:1)

前面https://gist.github.com/alotaiba/1730160所述的方法对我有用。我每天都在家庭自动化程序中使用它。我使用python脚本捕获音频并确定什么是有用的音频或只是噪音,然后它将小音频片段发送到谷歌并返回文本一秒钟内!我已经成功地将它整合到我的程序中,如果你在谷歌周围,你会发现更多的人也有这个!