c# - MS＃SAPI SpeechRecognitionEngine在C＃完全错误的转录

MS＃SAPI SpeechRecognitionEngine在C＃完全错误的转录

时间：2012-02-26 00:12:52

标签： c# speech-recognition sapi

我是MS SAPI的新手，我正在尝试使用SpeechRecognitionEngine类在C＃/ Windows窗体中编写WAV到TXT转换实用程序。我注意到这个演讲是完全错误的。这些话甚至听起来都不相似。我猜这可能受到一长串因素的影响，例如输入WAV文件的声音质量和加载到识别引擎中的语法。我正在使用DictationGrammar类。

我很欣赏经验丰富的语音识别/数字信号处理人员带来的任何线索。

1 个答案:

答案 0 :(得分：0)

您可能会遇到令人失望的结果。首先，如果您使用的是桌面识别器，则应该为扬声器进行训练。

第二个想法是，如果要从Wav文件转换，则在选择该文件的格式时必须小心。您可能需要重新采样wav文件，因为语音识别引擎仅支持某些采样率。

每个样本8位
单声道单声道
每秒22,050个样本
PCM编码

在Windows上运行良好。有关详细信息，请参阅https://stackoverflow.com/a/6203533/90236。