Microsoft语音识别服务工厂音频格式

时间:2016-05-10 15:22:57

标签: c# speech-recognition bing-api microsoft-cognitive

在文档中说"音频必须是PCM,单声道,16位采样,采样率为8000 Hz或16000 Hz。"

假设我想使用DataClient,我将音频作为字节。我该怎么把它转换成那个?

1 个答案:

答案 0 :(得分:0)

首先,您要将字节数组转换为InputStream。然后,使用AudioSystem从该Inputstream创建AudioInputStream。拥有音频流后,您基本上拥有音频,您可以将其写入文件或做任何您喜欢的事情。

ByteArrayInputStream oInstream = new ByteArrayInputStream(ayAudioData); AudioInputStream oAIS = AudioSystem.getAudioInputStream(oInstream);