如何从MFCC特征数组计算单个特征向量

时间:2015-11-07 18:27:38

标签: python speech

我最近开始学习信号处理,目的是对信号进行一些机器学习。我想用Mel频率倒谱系数提取特征(参见维基百科页面,stackoverflow赢了,让我发布超过2个链接),然后使用贝叶斯分类器。

我找到了以下librairy,它似乎做了我想要的确切事情(http://python-speech-features.readthedocs.org/en/latest/)。它甚至还带有关于MFCC(http://www.practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/)的非常好的教程。

现在,让我们开展业务。根据我的理解,我应该为每个信号得到一个系数的1d向量。 python-speech-features中的函数mfcc返回一个形状矩阵(倒数的帧数X)。还有logfbank函数返回一个形状矩阵(滤波器组的帧数X)。

现在我有点迷失在如何从信号和函数mfcc和logfbank获取我应该训练我的模型的特征向量。

非常感谢任何帮助。谢谢。

0 个答案:

没有答案