我正在尝试使用NAudio接收实时语音并将其以字节数组发送到bing语音API。
我使用事件处理程序接收音频并发送到Bing Speech API。以下是我试过的代码。
private void Source_DataAvailable(object sender, WaveInEventArgs e)
{ //convert the sound into a byte array
writer.Write(e.Buffer, 0, e.BytesRecorded);
memoryStream = new MemoryStream(e.Buffer);
CallSpeechAPI(memoryStream);
}
当我尝试执行时,我们最终得到了以下回复。
响应: 好 {" RecognitionStatus":" InitialSilenceTimeout""偏移":5000000,"持续时间":0} 结束记录
当我尝试将存在的.wav文件转换为字节数组并将它们发送到工作正常的API时。但对于实时音频,我们正面临着这个问题。
有人可以帮助解决问题以及如何解决问题。
如果有任何接收实时音频作为字节数组的选项,请告诉我?
如果有任何示例代码,请与我们分享。
非常感谢提前
答案 0 :(得分:0)
我们将很快通过字节数组或io.stream支持音频流。敬请期待。谢谢你的耐心。
答案 1 :(得分:0)
new Speech SDK v0.4.0中提供了对音频输入流的支持:。您可以找到示例here。您只需要根据描述的here接口实现自己的AudioInputStream :: Read()和:: GetFormat()。
谢谢