标签: audio speech-recognition speech mfcc kaldi
我目前正在尝试复制一篇论文的作品,其中他们使用MFCC功能训练cnn而不在最后执行DCT。它基本上是滤波器组能量的对数。
我知道kaldi可以使用make_mfcc.sh脚本计算MFCC功能。但是,如果不能在最后执行DCT,那么脚本可以以某种方式被改变以计算MFCC,如果没有其他工具可以我这样做吗?
MFCC通常如下推导:
对信号进行傅立叶变换(窗口摘录)。
答案 0 :(得分:1)
您可以使用make_fbank脚本来提取日志能量。
make_fbank