标签: audio mfcc
我有一个概念性的问题。
我知道什么是mel尺度及其代表什么,我知道这种频谱图仍然有太多的信息供我需要。
我认为如果我们想减少频谱图的信息数量,我们就会使用MFCC。
但我真的不知道MFCC是什么以及它代表什么? 我在语音识别过程中使用MFCC矩阵,但我不明白该向量内的所有数字代表什么。
阵列是13x130,我不知道所有这些浮点数是什么意思。据我所知,我的音轨更长的是我的矩阵(例如13x250,13x400)。
我希望我能说清楚。