IBM Watson Speech to Text Websocket关闭(代码为1000)没有结果

时间:2016-02-25 02:26:52

标签: node.js websocket speech-to-text ibm-watson

我尝试使用ws包通过websocket使用基本的语音转文本服务。但在成功打开连接并发送初始消息后,我从未获得listening状态。 我还尝试发送音频和空二进制文件(表示上传过程已完成),但服务器始终返回close代码1000

以下是我的代码

'use strict';

var fs = require('fs');
var request = require('request');
var WS = require('ws');

var wsURI = 'wss://stream.watsonplatform.net/speech-to-text/api/v1/recognize?watson-token=[TOKEN]&model=en-UK_NarrowbandModell&x-watson-learning-opt-out=1';
var getTokenForm = {
  method: 'GET',
  uri: 'https://[USER_ID]:[PASSWORD]@stream.watsonplatform.net/authorization/api/v1/token?url=https://stream.watsonplatform.net/speech-to-text/api',
};
var filepath = 'C:/Temp/test1.wav';

request(getTokenForm, function(error, response, body) {
  wsURI = wsURI.replace('[TOKEN]', body);
  var message = {
    'action': 'start',
    'content-type': 'audio/wav',
    'continuous': true,
    'inactivity_timeout': -1
  };
  var ws = new WS(wsURI);

  ['message', 'error', 'close', 'open', 'connection'].forEach(function(eventName) {
    ws.on(eventName, console.log.bind(console, eventName + ' event: '));
  });

  ws.on('open', function(evt) {
    ws.send(JSON.stringify(message));
    setTimeout(function timeout() {
      var readStream = fs.createReadStream(filepath);
      readStream.on('data', function(data) {
        ws.send(data, {
          binary: true,
          mask: false,
        });
      });

      readStream.on('end', function() {
        ws.send(new Buffer(0), {
          binary: true,
          mask: false,
        });
      });
    }, 1000);
  });

  ws.on('close', function(data) {
    console.log(data)
  });
});

还尝试直接发送文件(没有流)。

var sound = fs.readFileSync(filepath);
ws.send(sound, { binary: true, mask: false});

并尝试添加自定义标头Authorization

var authorization = 'Basic ' + new Buffer('USER_ID:PASSWORD').toString('base64');
var ws = new WS(wsURI, {
    headers: {
        'Authorization': authorization,
    }
});

但到目前为止没有运气。

1 个答案:

答案 0 :(得分:1)

这里有几件事。主要问题是查询字符串中的模型有一个拼写错误 - 最后应该只有一个'l'。 (虽然没有回复错误消息是我要向团队报告的服务中的错误。)

所以,修复它,你会得到一个错误,应该屏蔽帧。这是一个简单的解决方法,只需在两个地方切换mask: falsetrue

然后,一旦你完成了音频和音频的发送结束消息,服务将发送您的最终结果,然后发送另一条{"state": "listening"}消息。第二个state: listening应该是您关闭连接的触发器。否则它将最终超时并自动关闭(inactivity_timeout适用于您发送没有语音的音频,而不是在您根本不发送任何数据时。)