我已经成功提取了MFCC系数,并且我得到了低于值
-15.2366
6.4996
-2.1807
0.2495
-1.3403
0.9815
-0.1106
1.7914
0.7311
1.1881
1.3340
2.6080
1.4208
2.0144
0.5085
-1.1236
-1.2728
-0.9470
-0.8139
0.8987
1.6006
1.6000
0.4638
0.3747
0.0670
-0.0620
0.6234
0.0614
0.0964
0.2334
-0.2188
0.0591
0.6765
0.3943
-0.1409
0.1894
0.0004
-0.4762
-0.1273
0.1655
-0.0649
-0.2606
0.0075
-0.1275
-0.2038
-0.1332
0.2084
0.5128
0.8877
0.5406
现在如何从这些值中提取特征。 谢谢
答案 0 :(得分:0)
MFCC已经是您必须用来训练识别引擎(通常是HMM)的功能。
但是,您是如何提取这些功能的? 我假设矢量代表您正在处理的音频文件中单个100ms窗口的MFCC,因为典型的MFCC看起来像N-by-M矩阵。 N是用于提取要素的窗口数,M取决于您如何提取MFCC(通常M = 39)。