我正在尝试学习和使用语音识别应用程序, 搜索和搜索时间过长,找到了许多有用的信息和指南..
最后我发现并使用了这个项目:HERE
它工作得很好,直到我尝试了一些嘈杂的背景样本..
我尝试添加自定义语法和Dictation,尝试仅使用Custom Grammar, 但仍然得到相同的结果(或更糟)..
_speechRecognitionEngine.LoadGrammar(_dictationGrammar);
_speechRecognitionEngine.LoadGrammar(new Grammar(new GrammarBuilder(new Choices("a", "b", "c",
"d","e","f","g","h","i","j","k","l","m","n","o","p","q","r","s","t","u",
"v","w","x","y","z","please","type","the","letters","you","hear"))) { Name = "NewGrammar" });
_speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
总是相同的结果:请输入你听到其工作人员的信件..
任何信件总是会产生:员工。
那么,有没有办法减少背景噪音?或编辑WAV样本?
和一个新手问题:是否可以使用一些音频样本作为选择? (以字节读取然后比较或其他)。
要测试的音频样本:Audio Sample
此样本的正确结果应为:请输入您听到的字母H C D V A 。
答案 0 :(得分:0)
我正在探索类似的问题。您可以通过另一个具有噪音消除功能和脚本或命令行模式(例如Audacity's或Sox)的应用程序过滤相关文件。可以使用Process class从C#程序调用它们。
或者,为此目的,有一个商业许可的.NET库https://visualstudiogallery.msdn.microsoft.com/53d1f3fc-44d2-4a53-8211-99ca4b70536d。