我目前正处于语音识别的讨论阶段项目中,我使用MFCC特征提取,但从函数返回的MFCC特征是矩阵,e,g。每个语音文件(wav)的(20,38)特征矩阵。但是如何将此功能传递给SVM分类器。对于SVM(和其他分类器),每个样本由向量表示,对吗?但每个样品的MFCC特征是一个矩阵。假设Xi是样本i的MFCC特征,则样本i传递给SVM的特征是: 1)20 * 38载体,例如, Xi(:)以matlab形式出现。 2)平均值(Xi)。 3)Xi中的一列或一列。 哪条路对不对?任何有用的代码,纸张吗?
谢谢! 闪耀
答案 0 :(得分:5)
对于像语音识别这样的序列标记任务,您需要使用SVM和HMM的组合,而不仅仅是SVM
了解更多信息
http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.442
要快速使用,请使用现有的工具包,例如: