我们正在寻找api来获取文本语音。在我们的例子中,我们希望为视频文件添加音频,这意味着我们希望自动为视频生成标记,并让用户有机会直接跳转到标语的时间码。
我发现Google Speech API似乎运行良好,但http://lists.w3.org/Archives/Public/public-xg-htmlspeech/2011Feb/att-0020/api-draft.html下的文档不是最好的,我们还没有找到一种方法来自动触发启动和停止记录事件(它结束了)系统认为输入结束后)。即使听起来系统还没有为这种情况做好准备......
我在这里也发现了这篇文章https://stackoverflow.com/questions/2080401/is-there-a-speech-to-text-api-by-google,但它似乎只能在Android系统上发布。
所以基本上我的问题是:是否可以使用像Flash或PHP / JS这样的Google Speech API(如果有的话还有很好的例子),如果没有,有没有人知道一些其他的API和一些好的文档或示例代码将视频中的语音转换为文本?
谢谢, 克里斯
答案 0 :(得分:1)
回答自己:似乎没有办法在Web应用程序上使用Google Speech API作为免费语音识别引擎。目前,谷歌将其用于自己的使用。希望他们能尽快改变它;)
我们正在使用Microsoft Speech API(SAPI)。不是最好的结果,但还可以。