我需要自动转录一些简短的MP3作为我正在进行的概念验证的一部分。我目前正在研究云解决方案或Web API服务,将MP3作为简单的HTTP请求发送并接收转录。
我找到的唯一免费/开源解决方案here,但演示似乎不起作用(至少不是我需要转录的文件)。我已经为呼叫中心找到了一些企业解决方案,但到目前为止我无法简单地集成到项目中。
是否有基于网络的语音识别服务?一个能够滤除小噪音的人将是一个加号。
答案 0 :(得分:5)
以下an unofficial method可访问Google ASR功能。我刚刚在昨天进行了测试,它仍然可以工作 - 你可以从16KHz采样的FLC音频中获得带有单词和相关置信度得分的JSON样式ASR输出。
答案 1 :(得分:1)
This可能是一个很好的匹配。此外,他们的techcrunch配置文件(See this)将竞争对手列为:SimulScribe,SpinVox,Vlingo,Nuance,Microsoft,Google 其中一些链接可能会有所帮助。
Vlingo,Bing和Google在云端都有识别器,但我不认为他们可以将它们公开编程。我相信只有他们的授权客户才能访问它们。
对于概念验证(和低容量),您是否考虑过使用Windows 7中的桌面语音引擎? What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?可能会有所帮助。 MS桌面识别器带有听写语法,听起来就像你需要的那样。
答案 2 :(得分:1)
您也可以尝试Windows 7的语音识别引擎来制作字幕。 Here就是这个工具。