标签: algorithm audio signals signal-processing speech-recognition
我有两个音频wav文件,我必须在这两个wav文件中对齐相似或相同的内容。任何一个或两个wav文件中都可能有多余的内容(另一个WAV文件中没有的内容)。 我已经使用DTW算法进行了尝试,但是DTW甚至可以映射那些多余的组件,即仅存在于一个wav文件中。
输入将是两个音频wav文件,输出将是包含对齐部分的两个音频的窗口的时间戳。 可能有多个对齐方式。另外,任何wav文件中都可能会有一点噪音。因此,内容之间不需要完全对齐。但是,对齐的内容应该没有太大的不同。