我有很多不同的Android手机录制的音频片段,我还有一个用高端麦克风和Apple Logic录制的同一事件。
我想制作一张在Apple Logic录音和手机录音之间来回翻转的录音。我最初只是在他们的起点排列录音,但我注意到Android手机录音会随机跳过10到100个样本,因为我没有得到(I / O代码似乎正确并且在所有设备上生成大小相同的文件,所以我猜测AudioRecorder正在丢弃样本。)
所以我的问题是 - 是否有一个人们知道的工具或算法可以帮助运行批处理作业来识别音频被延迟的位置(超过某个阈值)并插入静音以使事物排成一行?我已经实现了一个粗略的RMS分析器,试图找到记录幅度之间的最佳拟合,但这并不总能做出正确的预测......
如果有人知道已经提议进行此类测量的算法,请告诉我们!
答案 0 :(得分:0)
您可以尝试将Android音频片段拆分为小部分(小于两次跳过之间的预期时间)。然后使用零件与参考的互相关。如果互相关很强,那么该部分很可能不包含跳过(或者包含它接近或在其中一个端点。如果互相关不强,那么必须在某个地方中间跳过对于这些部分,将它们分成两半并重复每个部分的相关过程。