应用错误收集

时间：2010-11-10 06:45:22

标签： api cloud speech-recognition

我需要自动转录一些简短的MP3作为我正在进行的概念验证的一部分。我目前正在研究云解决方案或Web API服务，将MP3作为简单的HTTP请求发送并接收转录。

我找到的唯一免费/开源解决方案here，但演示似乎不起作用（至少不是我需要转录的文件）。我已经为呼叫中心找到了一些企业解决方案，但到目前为止我无法简单地集成到项目中。

是否有基于网络的语音识别服务？一个能够滤除小噪音的人将是一个加号。

答案 0 :(得分：5)

以下an unofficial method可访问Google ASR功能。我刚刚在昨天进行了测试，它仍然可以工作 - 你可以从16KHz采样的FLC音频中获得带有单词和相关置信度得分的JSON样式ASR输出。

答案 1 :(得分：1)

This可能是一个很好的匹配。此外，他们的techcrunch配置文件（See this）将竞争对手列为：SimulScribe，SpinVox，Vlingo，Nuance，Microsoft，Google 其中一些链接可能会有所帮助。

Vlingo，Bing和Google在云端都有识别器，但我不认为他们可以将它们公开编程。我相信只有他们的授权客户才能访问它们。

对于概念验证（和低容量），您是否考虑过使用Windows 7中的桌面语音引擎？ What is the difference between System.Speech.Recognition and Microsoft.Speech.Recognition?可能会有所帮助。 MS桌面识别器带有听写语法，听起来就像你需要的那样。

答案 2 :(得分：1)

您也可以尝试Windows 7的语音识别引擎来制作字幕。 Here就是这个工具。