IBM Watson语音转文本“无法转码数据流音频/ webm->音频/ x-float-array”媒体MIME类型

时间:2020-03-18 22:57:36

标签: audio ibm-watson speech-to-text getusermedia ibm-cloud-speech

我正在使用mediaDevices.getUserMedia()在Chrome中录制简短的音频文件(几秒钟),将文件保存到Firebase Storage,然后尝试将文件发送到IBM Watson Speech-to-Text。我回来了此错误消息:

unable to transcode data stream audio/webm -> audio/x-float-array

在浏览器中,我设置了麦克风:

navigator.mediaDevices.getUserMedia({ audio: true, video: false })
.then(stream => {

var options = {
   audioBitsPerSecond : 128000,
   mimeType : 'audio/webm'
};

const mediaRecorder = new MediaRecorder(stream, options);
mediaRecorder.start();
...

根据this answer,Chrome仅支持两种媒体类型

audio/webm
audio/webm;codecs=opus

我都尝试过。

这是我发送给IBM Watson的邮件:

curl -X POST -u "apikey:my-api-key" \
--header "Content-Type: audio/webm" \
--data-binary "https://firebasestorage.googleapis.com/v0/b/my-app.appspot.com/my-file" \
--url "https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/01010101/v1/recognize"

supported MIME types的列表包括webmwebm;codecs=opus

我尝试记录并发送ogg格式的文件,并得到了相同的错误消息:

curl -X POST -u "apikey:my-api-key" \
--header "Content-Type: audio/ogg" \
--data-binary @/Users/TDK/LanguageTwo/public/1.ogg \
--url "https://api.us-south.speech-to-text.watson.cloud.ibm.com/instances/01010101/v1/recognize"

我尝试了IBM的示例音频文件,它运行良好:

"transcript": "several tornadoes touched down as a line of severe thunderstorms swept through Colorado on Sunday "

我从Google云语音转文本中获得了similar error message

0 个答案:

没有答案