Question

我有不同时间开始和结束的录音。

audio 1: -----t1--------------------------s1->time
audio 2: ---------t2----s2------------------->time
audio 3: ------------------------t3-------s3->time

音频1是最长的，它与音频2和3重叠。音频2和音频3是短段但它们根本不重叠。有没有这样做的python库？

Answer 1

您可以先使用python库读取音频文件（例如numpy或scipy，请参阅https://stackoverflow.com/a/26716031/3244382）。

然后你必须确定每个文件的t和s 。如果文件不太嘈杂，则音频信号上的简单阈值就足够了。稍微复杂一点的方法是计算 RMS能量或包络（平均信号），并在其上使用阈值。

一旦您知道 s 和 t ，您就可以使用相同的音频库从此边界编写新的音频文件。

对齐在不同时间开始和结束的音频文件

1 个答案: