如何使用mfcc功能训练svm分类器进行语音识别?

时间:2013-03-01 13:28:49

标签: svm voice-recognition mfcc

我目前正处于语音识别的讨论阶段项目中,我使用MFCC特征提取,但从函数返回的MFCC特征是矩阵,e,g。每个语音文件(wav)的(20,38)特征矩阵。但是如何将此功能传递给SVM分类器。对于SVM(和其他分类器),每个样本由向量表示,对吗?但每个样品的MFCC特征是一个矩阵。假设Xi是样本i的MFCC特征,则样本i传递给SVM的特征是: 1)20 * 38载体,例如, Xi(:)以matlab形式出现。 2)平均值(Xi)。 3)Xi中的一列或一列。 哪条路对不对?任何有用的代码,纸张吗?

谢谢! 闪耀

1 个答案:

答案 0 :(得分:5)

对于像语音识别这样的序列标记任务,您需要使用SVM和HMM的组合,而不仅仅是SVM

  1. 使用GMM-HMM将特征矩阵与状态对齐,获得与每个HMM状态对应的特征
  2. 在属于每个州的功能上训练SVM
  3. 实施SVM-HMM代替GMM-HMM
  4. 了解更多信息

    http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442

    要快速使用,请使用现有的工具包,例如:

    http://www.cs.cornell.edu/people/tj/svm_light/svm_hmm.html