IBM Watson语音转文本“识别音频”方法?

时间:2020-03-19 16:56:36

标签: node.js ibm-cloud ibm-watson speech-to-text ibm-cloud-speech

如何使用recognize方法将音频文件发送到语音转文本进行转录?音频文件在哪里访问?是否有地方可以放置本地文件,Google存储位置或下载URL的路径?

documentation说:

enter image description here

好的,那就是我要做的!文档说这是方法:

recognize(params, [callback()])

我看到的参数是:

var params = {
  objectMode: true,
  contentType: 'audio/flac',
  model: 'en-US_BroadbandModel',
  keywords: ['colorado', 'tornado', 'tornadoes'],
  keywordsThreshold: 0.5,
  maxAlternatives: 3
};

是否有MediaFileUri的参数?

1 个答案:

答案 0 :(得分:1)

您的链接是到node.js sdk文档的。在这种情况下,音频将作为参数audio发送,该参数应该为NodeJS.ReadableStreambuffer。您可以从url创建可读的流,在这种情况下,您可以添加:


params.audio = fs.createReadStream(url);

需要URL指向音频文件,而不是带有音频播放器的伪装网页。