对齐在不同时间开始和结束的音频文件

时间:2016-07-13 07:01:01

标签: python audio

我有不同时间开始和结束的录音。

audio 1: -----t1--------------------------s1->time
audio 2: ---------t2----s2------------------->time
audio 3: ------------------------t3-------s3->time

音频1是最长的,它与音频2和3重叠。 音频2和音频3是短段但它们根本不重叠。 有没有这样做的python库?

1 个答案:

答案 0 :(得分:0)

您可以先使用python库读取音频文件(例如numpy或scipy,请参阅https://stackoverflow.com/a/26716031/3244382)。

然后你必须确定每个文件的t和s 。如果文件不太嘈杂,则音频信号上的简单阈值就足够了。稍微复杂一点的方法是计算 RMS能量包络(平均信号),并在其上使用阈值。

一旦您知道 s t ,您就可以使用相同的音频库从此边界编写新的音频文件。