答案 0 :(得分:4)
要获取MFCC,请在梅尔频谱图上计算DCT。 MFCC是一种非常可压缩的表示形式,通常仅使用20或13个系数,而不是梅尔频谱图中的32-64个波段。 MFCC具有更多的去相关性,这对于线性模型(例如高斯混合模型)可能是有益的。借助大量数据和强大的分类器(例如卷积神经网络),梅尔频谱图通常可以表现更好。
答案 1 :(得分:0)
我想,琼诺的答案并不完全正确。分两个步骤:
1.记录梅尔光谱图。
2.计算日志上的DCT。
此外,记录日志似乎是培训NN的“主要部分”:https://qr.ae/TWtPLD