无法将语音转换为文本

时间:2017-01-29 15:49:59

标签: audio encoding ffmpeg speech-recognition wit.ai

使用Wit.ai网站将简单的MP3文件从语音转换为文本时出现500错误。

我认为我发送的WAV格式不正确。这是我的转换:

ffmpeg -i input.mp3 -acodec pcm_s16le -ac 1 -ar 16000 input.wav

这给了我一个带有pcm_s16le([1] [0] [0] [0] / 0x0001),16000 Hz,单声道,s16,256 kb / s的WAV文件

这是我的要求:

curl -X "POST" "https://api.wit.ai/speech?v=20160526" \
     -H "Authorization: Bearer TOKEN_HERE" \
     -H "Content-Type: audio/wav"

我在请求中将文件作为二进制内容发送。我也试过MP3,但它也不起作用。知道为什么吗?

1 个答案:

答案 0 :(得分:0)

结束了无法处理超过10秒的音频文件。他们应该为此实施一个特定的400 Bad Request,也许应该对此进行回应。