我正在与MFCC合作开展一个关于语音识别的项目。根据本网站http://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/中的文件,计算Mel-filterbank的公式如下:
`H (k, m) = 0 if ( k < f[m-1] )
= (k - f(m-1)) / (f[m] - f[m-1]) if ( f[m-1] <= k <= f[m] )
= (f[m+1] - k) / (f[m+1] - f[m]) if ( f[m] <= k <= f[m+1] )
= 0 if ( k > f[m+1] )`
我觉得这里出了点问题。什么是“k”?这个网站不是唯一的网站。我搜索了很多文档,它仍然存在。此外,如果m == 1,则不计算f [0],因此条件(k
答案 0 :(得分:1)
您正在定义一个函数H
,它接受正式参数k
和m
。这就是k的定义方式。 f[0]
完全明确。
基本上,公式会将此格式___/\___
描述为k=f[m]
处的峰值。