如何从mfcc系数中提取特征

时间:2014-03-18 07:25:20

标签: speech-recognition feature-extraction mfcc

我已经成功提取了MFCC系数,并且我得到了低于值

  -15.2366
    6.4996
   -2.1807
    0.2495
   -1.3403
    0.9815
   -0.1106
    1.7914
    0.7311
    1.1881
    1.3340
    2.6080
    1.4208
    2.0144
    0.5085
   -1.1236
   -1.2728
   -0.9470
   -0.8139
    0.8987
    1.6006
    1.6000
    0.4638
    0.3747
    0.0670
   -0.0620
    0.6234
    0.0614
    0.0964
    0.2334
   -0.2188
    0.0591
    0.6765
    0.3943
   -0.1409
    0.1894
    0.0004
   -0.4762
   -0.1273
    0.1655
   -0.0649
   -0.2606
    0.0075
   -0.1275
   -0.2038
   -0.1332
    0.2084
    0.5128
    0.8877
    0.5406

现在如何从这些值中提取特征。 谢谢

1 个答案:

答案 0 :(得分:0)

MFCC已经是您必须用来训练识别引擎(通常是HMM)的功能。

但是,您是如何提取这些功能的? 我假设矢量代表您正在处理的音频文件中单个100ms窗口的MFCC,因为典型的MFCC看起来像N-by-M矩阵。 N是用于提取要素的窗口数,M取决于您如何提取MFCC(通常M = 39)。