标签: audio sox
我试图在短时间内检测语音音量超过阈值,2-3秒,带有sox的音频文件,但无论是静音还是噪音,它总是会出现约90%的最大音量。
这是我使用的命令(我已尝试改变比例选项):
sox noise.wav -n stats -s 99
如果我大喊大叫并将麦克风放在嘴里或者猛击它,我可以获得大约95%音量的可检测差异,但它是台式麦克风。播放音频文件时会录制一个可听见的静音,但从远处说话时仍有很大的区别。
是否缺少设置或有其他人遇到此情况?