文本识别软件是否可用作库或包?或者,我可以从其他程序调用chrome来将某些音频文件转录为文本吗?
答案 0 :(得分:1)
Web Speech API仅适用于Chrome或Android环境。客户端中有很多工作要做,因此没有公共服务器到服务器API,只需要一个音频文件并对其进行处理。
如果你搜索github,你会发现https://gist.github.com/alotaiba/1730160等工具,但我很确定这种访问方法是100%不受支持,认可或确认继续工作。
答案 1 :(得分:1)
前面https://gist.github.com/alotaiba/1730160所述的方法对我有用。我每天都在家庭自动化程序中使用它。我使用python脚本捕获音频并确定什么是有用的音频或只是噪音,然后它将小音频片段发送到谷歌并返回文本一秒钟内!我已经成功地将它整合到我的程序中,如果你在谷歌周围,你会发现更多的人也有这个!