在Node.js中解析Watson TTS HTTP响应

时间:2018-12-19 12:15:21

标签: javascript node.js text-to-speech ibm-watson watson-text-to-speech

由于IBM更改了Watson的身份验证方法,因此我们试图在代码中实现该方法,但是我们无法使用其SDK或原始Websocket从TTS服务接收任何数据。

唯一起作用的是HTTP API,它返回诸如this之类的响应。它不是有效的json,也不是缓冲区。

我们已经在nodejs SDK中打开了issue,但是现在我们想使用HTTP API。

以下是获得类似回复的方法:

let requestPromise = require('request-promise-native');
let fs = require("fs")

let postData = {
    "grant_type":"urn:ibm:params:oauth:grant-type:apikey",
    "apikey":"<api_key>"
};

let opts = {
    uri : "https://iam.bluemix.net/identity/token",
    headers : {
        "Content-Type": "application/x-www-form-urlencoded",
        "Accept": "application/json"
    },
    method: "POST",
    form: postData
}

requestPromise(opts).then((body)=>{
    let token = JSON.parse(body).access_token;

    let postData = {
        "text": 'Hello world',
        "accept": 'audio/mp3',
        "voice": 'en-US_AllisonVoice'
    };

    let opts = {
        uri : "https://gateway-syd.watsonplatform.net/text-to-speech/api/v1/synthesize",
        headers : {
            "Content-Type": "application/json",
            "Accept": "application/json",
            // "Accept": "audio/mp3",
            'Content-Length' : Buffer.byteLength(JSON.stringify(postData)),
            "Authorization": "Bearer "+token
        },
        method: "POST",
        json: postData
    }

    requestPromise(opts).then((body)=>{
        let chunkStream = fs.createWriteStream('./audio.mp3')
        let buf = Buffer.from(body, 'base64')
        chunkStream.write(buf)
    }).catch((err)=>{
        if (err) throw err;
    })
}).catch((err)=>{
    if (err) throw err;
})

我们不知道如何处理该响应,并将其作为base64缓冲区保存到mp3,产生损坏的音频文件,如果您将响应直接保存到该文件或更改了Accept的{​​{1}}标头。我们甚至尝试通过mp3val运行音频文件,该文件解决了许多类似的问题,但是也没有用。

1 个答案:

答案 0 :(得分:4)

您可以使用官方的node api来获得结果:

npm install --save watson-developer-cloud

然后是

var TextToSpeechV1 = require('watson-developer-cloud/text-to-speech/v1');
var fs = require('fs');

var textToSpeech = new TextToSpeechV1({
  iam_apikey: 'API_KEY',
  url: 'https://gateway-syd.watsonplatform.net/text-to-speech/api/'
});

var synthesizeParams = {
  text: 'How are you doing?',
  accept: 'audio/wav',
  voice: 'en-US_AllisonVoice'
};


textToSpeech.synthesize(synthesizeParams, function (err, audio) {
  if (err) {
    // do something
    console.log('failure');
    return;
  }

  fs.writeFileSync('result-audio.wav', audio);
  console.log('scuccess');
  });

请注意,将其包装到TextToSpeechV1中会更改链接,因为 / v1 / synthesize 被称为implicitly