使用avconv如何为Google Speech to Text创建linear16文件

时间:2016-10-27 23:17:58

标签: avconv google-speech-api

我正在尝试使用av​​conv为Google的语音文本创建一个LINEAR16原始文件,但每当我尝试时,当我尝试使用文档中的play命令播放它时,我得到一个非常慢的文件:

play --rate=16000 --bits=16 --endian=little --encoding=signed-integer --channels=1 out.raw

进行这种转换的正确方法是什么?

1 个答案:

答案 0 :(得分:1)

需要一些实验,但我能够通过明确说明采样率,通道数和输出格式来实现它:

avconv -i michael_queen_v._ed_schultz_cl.mp3 -f s16le -ac 1 -ar 16k out.raw

-f:这会强制输出编码,因为.raw显然不足以让它知道该怎么做。

-ac 1:Mono

-ar 16k:这听起来像a gun,这令人沮丧,但这会将采样率设置为16000MHz。