检测音频文件中的声音边界

时间:2015-08-01 18:22:37

标签: python opencv audio

我有一个音频文件,我想分成多个文件。文件被构造成由沉默分开的成对声音。时间轴看起来像 - 表示沉默:

-----声音A1 -----声音A2 -----声音B1 -----声音B2 -----

我想找到Sound A2和Sound B1之间的界限。我想要一个解决方案,最好使用Python,OpenCV和FFmpeg的组合,但任何有用的工具都可以。

1 个答案:

答案 0 :(得分:4)

感谢Miki的链接。 Aubio是一个完美运作的工具。程序aubioquiet将检测静默边界并打印其时间戳:

$ aubioquiet temp.wav NOISY: 0.638549 QUIET: 2.008526 NOISY: 4.992290 QUIET: 6.286803 NOISY: 9.258957 QUIET: 10.559275 NOISY: 13.531428 QUIET: 14.622766 NOISY: 17.623945 QUIET: 18.953287 NOISY: 21.931248 QUIET: 23.260590 NOISY: 26.238548 QUIET: 27.643356 NOISY: 30.632925 QUIET: 31.915827 NOISY: 34.882175 QUIET: 36.165081