标签: speech-recognition voice-recognition sox libsox
我正在尝试将sox实施到语音识别程序中。 然而,sox花了将近10秒来用非常简单的句子修剪单词5-7个单词(文件大小也在200-400kb之间) 这是不可接受的。 我可以做什么,或者可以将哪些其他选项用于同一目标。 顺便说一句,我使用的sox参数是
sox -c 1 -r 16000 input.wav output.wav silence 1 0.5 1%1 0.1 1%:newfile:restart