如何比较两个MFCC特征向量或两个语音话语的MFCC特征向量之间的相似性

时间:2014-09-20 14:16:11

标签: speech-recognition text-to-speech mfcc

我已经提取了两个话语的13个MFCC特征。第一个话语的特征集大小为11 * 13,其他为18 * 13。那么,如何比较两个特征集来找出这两个词之间的相似性呢?

如果有人知道,我没有使用任何分类器,标准工具使用哪种算法来比较MFCC特征向量。请建议我,以便我可以实施它。

2 个答案:

答案 0 :(得分:5)

您可以在matlab中尝试以下代码。 在将mfcc用于2波之后,我们假设对于第一波mfcc1和第二波是mfcc2。 代码是:

mfcc1=mfcc1';
mfcc2=mfcc2';
M=simmx(mfcc1,mfcc2);
[p,q,c]=dp(1-M);
v=c(size(c,1),size(c,2))

复制代码并运行mfcc值为mfcc1和mfcc2,


我使用了dtw逻辑,我采用了mfcc的逆,然后我采用相似矩阵,我找到了最低成本路径。 如果匹配完美,则值为0 如果它接近匹配你将接近零值  。我希望这个能帮上忙 。 谢谢....

答案 1 :(得分:4)

比较两个不同长度的序列的算法被称为"动态时间扭曲",你可以在维基百科中找到一个广泛的描述:

http://en.wikipedia.org/wiki/Dynamic_time_warping

有许多参考实现可用于不同的语言。