音频对齐(不同发言者的同一句话)

时间:2017-10-18 02:00:44

标签: python audio alignment mfcc dtw

我是音频处理的新手。我有一个参考音频文件和几个其他录音(不同发言者说的相同句子 - 方言和持续时间不同),我想将所有音频文件与最小翘曲的一个音频参考文件对齐。我尝试使用MFCC和Chroma功能(python / librosa),但我不知道接下来该做什么。我正在阅读关于DTW(动态时间扭曲)的对齐,这会有用吗?是否有一个示例/开源项目或音频工具已经这样做了?这似乎是一个解决的问题,但我找不到它。请帮忙。

我正在读这篇文章 - https://librosa.github.io/librosa_gallery/auto_examples/plot_music_sync.html但如何在时域中保存对齐的音频?

这看似相关 - Dynamic time warping with python (final mapping)

0 个答案:

没有答案