我正在使用Azure认知服务中的Bing Text to Speech api。
post_option.headers = {
'content-type' : 'application/ssml+xml',
'Content-Length' : post_data.length,
'X-Microsoft-OutputFormat' : 'riff-8khz-8bit-mono-mulaw',
'Authorization': 'Bearer ' + OxfordAccessToken.access_token,
'X-Search-AppId': '',
'X-Search-ClientID': '',
"User-Agent": "TTSNodeJS"
};
var post_req = https.request(post_option, function(res){
var _data="";
res.on('data', function(buffer){
//get the wave
_data += buffer;
});
// end callback
res.on('end', function(){
console.log('wave data.length: ' + _data.length);
});
post_req.on('error', function(e) {
console.log('problem with request: ' + e.message);
});
});
我收到了字符串格式的音频原始数据。我想将数据保存为.mp3或.mp4文件。我可以使用以下代码将原始数据保存为.wav。
var fs = require('fs')
fs.writeFile('./audio.wav', data, 'binary', function(err) {
if(err) console.log(err);
else console.log("File saved");
});
但是结尾的二进制音频文件充满了噪音,无法使用。当使用16位标头时,音频文件会产生更多噪音。
我需要帮助将输出数据保存到.mp3 / .mp4音频文件而不会产生噪音,请提示一种方法。
答案 0 :(得分:0)
我利用request
模块来实现此功能,创建的音频文件清晰,没有您提到的任何噪音。这是我的测试代码片段:
var SsmlTemplate = "<speak version='1.0' xml:lang='en-us'><voice xml:lang='%s' xml:gender='%s' name='%s'>%s</voice></speak>";
var post_data = util.format(SsmlTemplate, 'en-US', 'Female', 'Microsoft Server Speech Text to Speech Voice (en-US, ZiraRUS)', 'This is a demo to call microsoft text to speach service in javascript.');
console.log('\n\ntts post_data: ' + post_data + '\n');
var post_option = {
url: "https://speech.platform.bing.com/synthesize",
method: 'POST',
body :post_data
};
post_option.headers = {
'content-type': 'application/ssml+xml',
// 'Content-Length': post_data.length,
'X-Microsoft-OutputFormat': 'riff-16khz-16bit-mono-pcm',
'Authorization': 'Bearer ' + OxfordAccessToken.access_token,
'X-Search-AppId': '07D3234E49CE426DAA29772419F436CA',
'X-Search-ClientID': '1ECFAE91408841A480F00935DC390960',
"User-Agent": "TTSNodeJS"
};
var post_req = request.post(post_option).on('response', function(response) {
console.log(response.statusCode) // 200
console.log(response.headers)
}).pipe(fs.createWriteStream('audio.mp3',{defaultEncoding:'binary'}));
否则,您能否提供您的测试模板和当地环境。如有任何疑虑,请随时告诉我。