我有HTK从.wav文件生成的MFCC(Mel频率倒谱系数)文件。我需要的是从MFCC中提取时间跨度。当MFCC文件表示长度为90分钟的音频时,我希望得到例如MFCC为音频的第三分钟。
HTK书称MFCC文件由标题和连续的样本序列组成。但是以字节为单位确定样本的确切大小似乎并不重要。
是否有文件解析器? (当然,在HTK中,但我没有设法弄清楚如何使用二进制文件完成此任务。)
或者是否有一种简单的方法可以确定样本和标题的大小,以便能够简单地将文件分开?
答案 0 :(得分:2)
想出来。 HTK有一个工具。 HCopy可以将MFCC转换为MFCC并接受开始和结束的参数。
HCopy -C config0 -s 10e7 -e 11e7 source.mfcc target.mfcc
从源头截止00:10 .. 00:11。
config0应包含用于从wav创建原始mfcc的相同配置,但sourcekind设置为wav除外。