我有不同时间开始和结束的录音。
audio 1: -----t1--------------------------s1->time
audio 2: ---------t2----s2------------------->time
audio 3: ------------------------t3-------s3->time
音频1是最长的,它与音频2和3重叠。 音频2和音频3是短段但它们根本不重叠。 有没有这样做的python库?
答案 0 :(得分:0)
您可以先使用python库读取音频文件(例如numpy或scipy,请参阅https://stackoverflow.com/a/26716031/3244382)。
然后你必须确定每个文件的t和s 。如果文件不太嘈杂,则音频信号上的简单阈值就足够了。稍微复杂一点的方法是计算 RMS能量或包络(平均信号),并在其上使用阈值。
一旦您知道 s 和 t ,您就可以使用相同的音频库从此边界编写新的音频文件。