python - 检测音频文件中的声音边界

检测音频文件中的声音边界

时间：2015-08-01 18:22:37

标签： python opencv audio

我有一个音频文件，我想分成多个文件。文件被构造成由沉默分开的成对声音。时间轴看起来像 - 表示沉默：

-----声音A1 -----声音A2 -----声音B1 -----声音B2 -----

我想找到Sound A2和Sound B1之间的界限。我想要一个解决方案，最好使用Python，OpenCV和FFmpeg的组合，但任何有用的工具都可以。

1 个答案:

答案 0 :(得分：4)

感谢Miki的链接。 Aubio是一个完美运作的工具。程序aubioquiet将检测静默边界并打印其时间戳：

$ aubioquiet temp.wav NOISY: 0.638549 QUIET: 2.008526 NOISY: 4.992290 QUIET: 6.286803 NOISY: 9.258957 QUIET: 10.559275 NOISY: 13.531428 QUIET: 14.622766 NOISY: 17.623945 QUIET: 18.953287 NOISY: 21.931248 QUIET: 23.260590 NOISY: 26.238548 QUIET: 27.643356 NOISY: 30.632925 QUIET: 31.915827 NOISY: 34.882175 QUIET: 36.165081

检测声音Javascript
android：检测声级
在android中检测'Whistle'声音
检测原始pcm数据中的声级
如何检测原始声音文件中的声音
检测音频文件中的特定声音
检测声音文件中的重复
检测音频中的特定声音
检测声卡播放的文件
检测音频文件中的声音边界

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？