应用错误收集

我是音频处理的新手。我有一个参考音频文件和几个其他录音（不同发言者说的相同句子 - 方言和持续时间不同），我想将所有音频文件与最小翘曲的一个音频参考文件对齐。我尝试使用MFCC和Chroma功能（python / librosa），但我不知道接下来该做什么。我正在阅读关于DTW（动态时间扭曲）的对齐，这会有用吗？是否有一个示例/开源项目或音频工具已经这样做了？这似乎是一个解决的问题，但我找不到它。请帮忙。

我正在读这篇文章 - https://librosa.github.io/librosa_gallery/auto_examples/plot_music_sync.html但如何在时域中保存对齐的音频？

音频对齐（不同发言者的同一句话）

0 个答案: