我正在寻找关于动态时间扭曲(DTW)的一些建议。
我有一个Python脚本,并从各种长度的.WAV文件中提取Mel频率倒谱系数(MFCC)特征向量。特征向量是包含12个MFCC的阵列的不同长度的阵列。
例如,一个.WAV文件可以由包含10组12个特征向量的数组表示,而另一个.WAV文件可以由包含20组12个特征向量的一个数组表示。
我打算使用DTW来比较两个数组阵列,但我不确定如何。我理解DTW的概念,如果数组中包含的特征向量是单个数字,那么实现它就没有问题,我的困惑是由于它们是数组。
Tl; dr:如何使用DTW比较两个阵列数组?
编辑:我已阅读this个问题但无效。
非常感谢, 亚当
答案 0 :(得分:3)
我已经在十几篇论文中完成了这项工作,请参阅zebra finch example here
需要注意的关键事项。您可能只想将一个特征向量与相应的特征向量进行比较。很难使用全部12个。
答案 1 :(得分:0)