我尝试使用ws包通过websocket使用基本的语音转文本服务。但在成功打开连接并发送初始消息后,我从未获得listening
状态。
我还尝试发送音频和空二进制文件(表示上传过程已完成),但服务器始终返回close
代码1000
。
以下是我的代码
'use strict';
var fs = require('fs');
var request = require('request');
var WS = require('ws');
var wsURI = 'wss://stream.watsonplatform.net/speech-to-text/api/v1/recognize?watson-token=[TOKEN]&model=en-UK_NarrowbandModell&x-watson-learning-opt-out=1';
var getTokenForm = {
method: 'GET',
uri: 'https://[USER_ID]:[PASSWORD]@stream.watsonplatform.net/authorization/api/v1/token?url=https://stream.watsonplatform.net/speech-to-text/api',
};
var filepath = 'C:/Temp/test1.wav';
request(getTokenForm, function(error, response, body) {
wsURI = wsURI.replace('[TOKEN]', body);
var message = {
'action': 'start',
'content-type': 'audio/wav',
'continuous': true,
'inactivity_timeout': -1
};
var ws = new WS(wsURI);
['message', 'error', 'close', 'open', 'connection'].forEach(function(eventName) {
ws.on(eventName, console.log.bind(console, eventName + ' event: '));
});
ws.on('open', function(evt) {
ws.send(JSON.stringify(message));
setTimeout(function timeout() {
var readStream = fs.createReadStream(filepath);
readStream.on('data', function(data) {
ws.send(data, {
binary: true,
mask: false,
});
});
readStream.on('end', function() {
ws.send(new Buffer(0), {
binary: true,
mask: false,
});
});
}, 1000);
});
ws.on('close', function(data) {
console.log(data)
});
});
还尝试直接发送文件(没有流)。
var sound = fs.readFileSync(filepath);
ws.send(sound, { binary: true, mask: false});
并尝试添加自定义标头Authorization
var authorization = 'Basic ' + new Buffer('USER_ID:PASSWORD').toString('base64');
var ws = new WS(wsURI, {
headers: {
'Authorization': authorization,
}
});
但到目前为止没有运气。
答案 0 :(得分:1)
这里有几件事。主要问题是查询字符串中的模型有一个拼写错误 - 最后应该只有一个'l'。 (虽然没有回复错误消息是我要向团队报告的服务中的错误。)
所以,修复它,你会得到一个错误,应该屏蔽帧。这是一个简单的解决方法,只需在两个地方切换mask: false
到true
。
然后,一旦你完成了音频和音频的发送结束消息,服务将发送您的最终结果,然后发送另一条{"state": "listening"}
消息。第二个state: listening
应该是您关闭连接的触发器。否则它将最终超时并自动关闭(inactivity_timeout
适用于您发送没有语音的音频,而不是在您根本不发送任何数据时。)