Microsoft.Speech通用语言语法

时间:2011-09-08 14:14:26

标签: .net speech-recognition

如果我们使用语音识别的集成Windows 7功能,我们可以看到,它非常擅长猜测我们所指示的内容。它不仅适用于有限的命令集,而且适用于任何口语。

另一方面,当我尝试针对Microsoft.Speech命名空间中的类进行编程时(我已经安装了Microsoft Speech Server Runtime 10.2),我发现自己总是需要定义一个有限的语法来使用。

有没有办法只获取一个口述的音频文件并尝试将其解析为文本,而无需在Microsoft.Speech中指定自定义语法?

1 个答案:

答案 0 :(得分:4)

我的理解是桌面操作系统带有听写语法。但是,服务器识别器不包括听写语法,因为它们主要用于电话用户,其中用户向IVR系统发出短命令。对于更多背景知识,此问题可能会有所帮助 - What is the best option for transcribing speech-to-text in a asp.net web app?

请记住,桌面识别器一次只能由一个用户使用。他们可以接受培训,以提高每个用户的认可度。服务器识别器旨在同时处理许多用户。无法训练服务器识别器。也许,没有训练,准确的听写语法太难了? (或者,也许微软不想放弃他们所有最好的技术?)

我还阅读(但尚未检查)桌面识别器支持更高质量的音频(更高的比特率和样本大小),服务器识别器仅限于电话质量的音频。也许准确的转录需要更高质量的音频。