使用w4a格式音频的IBM语音文本(Node.js)

时间:2016-05-23 17:07:48

标签: node.js ibm-cloud speech-to-text ibm-watson

我尝试使用IBM语音文本API将messenger中的音频转录为文本脚本。

request({
        uri: attachment.url,
        method: 'GET',
        encoding: null
      }, (err, res, audio) => {... do something...}

我使用request从我收到的url中获取音频文件。 但我只能获得w4a文件,Watson只支持

  

音频/ FLAC

     

audio / wav

     

audio / l16

     

音频/ OGG

如何将w4a格式音频转换为符合规范的wav。

还是存在其他方法吗?

感谢。

1 个答案:

答案 0 :(得分:2)

使用像audiobuffer-to-wav这样的软件包将源音频文件(.w4a)转换为Watson STT兼容格式(如mp3 / wav),然后将转换后的文件与Watson STT API一起使用。而且,如果您需要使用此库服务器端,您可以使用web-audio-api包模拟AudioContext功能。