HTK:了解生成的.mlf文件中的分数

时间:2019-01-25 10:22:58

标签: machine-learning speech-recognition mfcc htk

我正在尝试了解文件结果recout.mlf,因此该文件中包含以下几行:

enter image description here

“ as”中的哪个发音很清楚:-524.427185或-1054.774536

1 个答案:

答案 0 :(得分:1)

在解码过程中获得的声学分数通常很小。为了防止下溢,使用对数似然代替可能性:1.5 Recognition and Viterbi Decoding

较小的参数值对应于较大的对数负值:

Natural log

因此,第一个“ as”获得了更高的(-524.427185)声学得分。对数是一个单调函数(参数越大,值越大),因此您可以直接比较对数似然:-524 > -1054

顺便说一句,它不一定意味着第一个“ as”的发音更好。声学分数取决于许多因素,包括模型拓扑和模型训练所依据的数据。