MS#SAPI SpeechRecognitionEngine在C#完全错误的转录

时间:2012-02-26 00:12:52

标签: c# speech-recognition sapi

我是MS SAPI的新手,我正在尝试使用SpeechRecognitionEngine类在C#/ Windows窗体中编写WAV到TXT转换实用程序。我注意到这个演讲是完全错误的。这些话甚至听起来都不相似。我猜这可能受到一长串因素的影响,例如输入WAV文件的声音质量和加载到识别引擎中的语法。我正在使用DictationGrammar类。

我很欣赏经验丰富的语音识别/数字信号处理人员带来的任何线索。

1 个答案:

答案 0 :(得分:0)

您可能会遇到令人失望的结果。首先,如果您使用的是桌面识别器,则应该为扬声器进行训练。

第二个想法是,如果要从Wav文件转换,则在选择该文件的格式时必须小心。您可能需要重新采样wav文件,因为语音识别引擎仅支持某些采样率。

  • 每个样本8位
  • 单声道单声道
  • 每秒22,050个样本
  • PCM编码

在Windows上运行良好。有关详细信息,请参阅https://stackoverflow.com/a/6203533/90236