如何在javascript中将原始数据转换为音频

时间:2016-08-12 04:30:34

标签: javascript node.js azure audio text-to-speech

我正在使用Azure认知服务中的Bing Text to Speech api

post_option.headers = {
        'content-type' : 'application/ssml+xml',
        'Content-Length' : post_data.length,
        'X-Microsoft-OutputFormat' : 'riff-8khz-8bit-mono-mulaw',
        'Authorization': 'Bearer ' + OxfordAccessToken.access_token,
        'X-Search-AppId': '',
        'X-Search-ClientID': '',
        "User-Agent": "TTSNodeJS"
    };

var post_req = https.request(post_option, function(res){
      var _data="";
       res.on('data', function(buffer){
           //get the wave
         _data += buffer;
         });

         // end callback
        res.on('end', function(){

        console.log('wave data.length: ' + _data.length);
        });

        post_req.on('error', function(e) {
        console.log('problem with request: ' + e.message);
        });
    });

我收到了字符串格式的音频原始数据。我想将数据保存为.mp3或.mp4文件。我可以使用以下代码将原始数据保存为.wav。

var fs = require('fs')
fs.writeFile('./audio.wav', data, 'binary', function(err) {
if(err) console.log(err);
else console.log("File saved");
});

但是结尾的二进制音频文件充满了噪音,无法使用。当使用16位标头时,音频文件会产生更多噪音。

我需要帮助将输出数据保存到.mp3 / .mp4音频文件而不会产生噪音,请提示一种方法。

1 个答案:

答案 0 :(得分:0)

我利用request模块来实现此功能,创建的音频文件清晰,没有您提到的任何噪音。这是我的测试代码片段:

        var SsmlTemplate = "<speak version='1.0' xml:lang='en-us'><voice xml:lang='%s' xml:gender='%s' name='%s'>%s</voice></speak>";
        var post_data = util.format(SsmlTemplate, 'en-US', 'Female', 'Microsoft Server Speech Text to Speech Voice (en-US, ZiraRUS)', 'This is a demo to call microsoft text to speach service in javascript.');
        console.log('\n\ntts post_data: ' + post_data + '\n');

        var post_option = {
            url: "https://speech.platform.bing.com/synthesize",
            method: 'POST',
            body :post_data
        };
        post_option.headers = {
            'content-type': 'application/ssml+xml',
            // 'Content-Length': post_data.length,
            'X-Microsoft-OutputFormat': 'riff-16khz-16bit-mono-pcm',
            'Authorization': 'Bearer ' + OxfordAccessToken.access_token,
            'X-Search-AppId': '07D3234E49CE426DAA29772419F436CA',
            'X-Search-ClientID': '1ECFAE91408841A480F00935DC390960',
            "User-Agent": "TTSNodeJS"
        };

        var post_req = request.post(post_option).on('response', function(response) {
            console.log(response.statusCode) // 200
            console.log(response.headers) 
          }).pipe(fs.createWriteStream('audio.mp3',{defaultEncoding:'binary'}));

否则,您能否提供您的测试模板和当地环境。如有任何疑虑,请随时告诉我。