我正在尝试使用一些音乐聚类算法,我认为使用由基本上离散的fft组成的特征向量(如离散化频率)将是一个很好的相似性度量。这甚至会有用吗?人们知道一些好的音频相似性措施可能是什么?
答案 0 :(得分:3)
首先,您需要决定是否需要指纹识别(即除了一些失真之外的身份)或相似性(但不是身份!)措施。
还可以看看MFCC,树皮鳞片等。那里有很多文献。去亚马逊,找一本关于这个主题的专门书。
答案 1 :(得分:0)
在离散之前,您可以使用像kd-tree或hilbert曲线这样的层次结构集群。群集降低了维度复杂度并改变了输入的顺序,而fft只是将其转换为波浪。