我正在使用Kinect + Microsoft.Speech进行语音识别。
要获取输入音频流,必须执行以下操作
Stream kinectAudioStream = myKinect.AudioSource.Start();
并开始语音识别
speechRecognitionEngine.SetInputToAudioStream(kinectAudioStream, new SpeechAudioFormatInfo(...));
speechRecognitionEngine.RecognizeAsync(RecognizeMode.Multiple);
我的目标是实时显示输入信号(如示波器)并同时进行语音识别。
我尝试了一些方法,例如在多个线程中向Microsoft“AudioBasics-WPF C# Sample”添加语音识别。它有效,但延迟非常非常糟糕。语音识别和可视化中断很多。
有没有办法提高性能?有人有想法吗?
答案 0 :(得分:0)
好吧,你最好的选择是下载到Kinect DMO并连接SmartTee过滤器,但这要求你用C ++编写,因为KinectAudioSource不会公开过滤器本身。