标签: algorithm voice frequency
我想获得一些音频的音色。
要使用它,我将制作Mel频率倒谱系数算法。
实现看起来很简单(我已经完成了第1步): 1.对信号进行傅立叶变换(窗口摘录)。 2.使用三角形重叠窗口将上面获得的光谱的功率映射到梅尔尺度上。 3.记录每个梅尔频率的功率记录。 4.采用mel对数列表的离散余弦变换,就像它是一个信号一样。 5. MFCC是所得光谱的幅度。
在第2步中,我知道如何从频率传递到梅尔规模,但我不知道三角形重叠窗口意味着什么..
如何正确执行此步骤? 三角形重叠窗口是什么意思?
答案 0 :(得分:0)
完成转换为mel刻度后,应用一组重叠的三角形滤波器,沿着此刻度均匀分布(因此对于低频率间距更近)。也就是说,在这里,您将从FFT返回的粗略连续曲线变为设置离散的20-50个离散值。
我用Google搜索过滤器的图片,发现了一些(包括pdf文件),here和here(第4页)。这些也在一定程度上描述了他们如何进行计算的其他细节。