我一直在玩sox并使用trim
命令将整个音频分成n个部分(每个部分固定长度)应该相当简单。
然而,由于我打算分割语音录音,可能会发生一个简单的分裂将在一个单词的中间分裂。
有没有办法防止这种情况,并确保部件包含"整个单词"?
答案 0 :(得分:7)
查看sox webpage上的 sox silence 命令。
sox original.wav new.wav silence 1 0.5 2% 1 2.0 2% : newfile : restart
original.wav - 要拼接的音频文件。
new.wav - 将是每个切片附加数字的新音频文件的名称(new1.wav,new2.wav,new3.wav ...)。
沉默 - 效果的名称。
1 0.5 2% - 超过期限,持续时间,门槛。
1 2.0 2% - below_periods,duration,threshold。