.net - Microsoft.Speech通用语言语法

Microsoft.Speech通用语言语法

时间：2011-09-08 14:14:26

标签： .net speech-recognition

如果我们使用语音识别的集成Windows 7功能，我们可以看到，它非常擅长猜测我们所指示的内容。它不仅适用于有限的命令集，而且适用于任何口语。

另一方面，当我尝试针对Microsoft.Speech命名空间中的类进行编程时（我已经安装了Microsoft Speech Server Runtime 10.2），我发现自己总是需要定义一个有限的语法来使用。

有没有办法只获取一个口述的音频文件并尝试将其解析为文本，而无需在Microsoft.Speech中指定自定义语法？

1 个答案:

答案 0 :(得分：4)

我的理解是桌面操作系统带有听写语法。但是，服务器识别器不包括听写语法，因为它们主要用于电话用户，其中用户向IVR系统发出短命令。对于更多背景知识，此问题可能会有所帮助 - What is the best option for transcribing speech-to-text in a asp.net web app?

请记住，桌面识别器一次只能由一个用户使用。他们可以接受培训，以提高每个用户的认可度。服务器识别器旨在同时处理许多用户。无法训练服务器识别器。也许，没有训练，准确的听写语法太难了？（或者，也许微软不想放弃他们所有最好的技术？）

我还阅读（但尚未检查）桌面识别器支持更高质量的音频（更高的比特率和样本大小），服务器识别器仅限于电话质量的音频。也许准确的转录需要更高质量的音频。