我有一个音频文件,我想分成多个文件。文件被构造成由沉默分开的成对声音。时间轴看起来像 - 表示沉默:
-----声音A1 -----声音A2 -----声音B1 -----声音B2 -----
我想找到Sound A2和Sound B1之间的界限。我想要一个解决方案,最好使用Python,OpenCV和FFmpeg的组合,但任何有用的工具都可以。
答案 0 :(得分:4)
感谢Miki的链接。 Aubio是一个完美运作的工具。程序aubioquiet将检测静默边界并打印其时间戳:
$ aubioquiet temp.wav
NOISY: 0.638549
QUIET: 2.008526
NOISY: 4.992290
QUIET: 6.286803
NOISY: 9.258957
QUIET: 10.559275
NOISY: 13.531428
QUIET: 14.622766
NOISY: 17.623945
QUIET: 18.953287
NOISY: 21.931248
QUIET: 23.260590
NOISY: 26.238548
QUIET: 27.643356
NOISY: 30.632925
QUIET: 31.915827
NOISY: 34.882175
QUIET: 36.165081