Question

我正在尝试使用NAudio接收实时语音并将其以字节数组发送到bing语音API。

我使用事件处理程序接收音频并发送到Bing Speech API。以下是我试过的代码。

private void Source_DataAvailable(object sender, WaveInEventArgs e)
    {   //convert the sound into a byte array

        writer.Write(e.Buffer, 0, e.BytesRecorded);
         memoryStream = new MemoryStream(e.Buffer);
        CallSpeechAPI(memoryStream);

    }

当我尝试执行时，我们最终得到了以下回复。

响应：好 {＆＃34; RecognitionStatus＆＃34;：＆＃34; InitialSilenceTimeout＆＃34;＆＃34;偏移＆＃34;：5000000，＆＃34;持续时间＆＃34;：0} 结束记录

当我尝试将存在的.wav文件转换为字节数组并将它们发送到工作正常的API时。但对于实时音频，我们正面临着这个问题。

有人可以帮助解决问题以及如何解决问题。

如果有任何接收实时音频作为字节数组的选项，请告诉我？

如果有任何示例代码，请与我们分享。

非常感谢提前

Answer 1

我们将很快通过字节数组或io.stream支持音频流。敬请期待。谢谢你的耐心。

Answer 2

new Speech SDK v0.4.0中提供了对音频输入流的支持：。您可以找到示例here。您只需要根据描述的here接口实现自己的AudioInputStream :: Read（）和:: GetFormat（）。

谢谢

将实时音频发送到bing Speech API

2 个答案: