我正在尝试使用avconv为Google的语音文本创建一个LINEAR16原始文件,但每当我尝试时,当我尝试使用文档中的play命令播放它时,我得到一个非常慢的文件:
play --rate=16000 --bits=16 --endian=little --encoding=signed-integer --channels=1 out.raw
进行这种转换的正确方法是什么?
答案 0 :(得分:1)
需要一些实验,但我能够通过明确说明采样率,通道数和输出格式来实现它:
avconv -i michael_queen_v._ed_schultz_cl.mp3 -f s16le -ac 1 -ar 16k out.raw
-f
:这会强制输出编码,因为.raw
显然不足以让它知道该怎么做。
-ac 1
:Mono
-ar 16k
:这听起来像a gun,这令人沮丧,但这会将采样率设置为16000MHz。