应用错误收集

我正在使用HTK工具包进行单词识别任务，并且经典培训和测试数据不匹配。训练数据仅由“干净”（通过麦克风记录）数据组成。数据被转换为MFCC_E_D_A参数，然后由HMM（电话级）建模。我的测试数据已经通过固定电话和移动电话频道录制（邀请失真等）。将MFCC_E_D_A参数与HVite一起使用会导致输出错误。我希望cepstral mean normalization使用MFCC_E_D_A_Z参数，但由于HMM未使用此数据建模，因此它没有多大用处。我的问题如下：

有什么方法可以将 MFCC_E_D_A_Z转换为MFCC_E_D_A？这样我就按照这种方式：input -> MFCC_E_D_A_Z -> MFCC_E_D_A -> HMM log likelihood computation。
有没有办法将模拟MFCC_E_D_A参数的现有HMM转换为MFCC_E_D_A_Z？

如果有办法从上面做（1），那么HCopy的配置文件是什么样的？我编写了以下HCopy配置文件进行转换：
SOURCEFORMAT = MFCC_E_D_A_Z TARGETKIND = MFCC_E_D_A TARGETRATE = 100000.0 SAVECOMPRESSED = T SAVEWITHCRC = T WINDOWSIZE = 250000.0 USEHAMMING = T PREEMCOEF = 0.97 NUMCHANS = 26 CEPLIFTER = 22 NUMCEPS = 12 ENORMALISE = T

这不起作用。我怎样才能改善这个？

从一种MFCC转换为另一种 - HTK

1 个答案: