如何直接读取HTK中的后部probs?

时间:2013-02-26 19:25:06

标签: probability htk

问候研究员,

我正在拼命地试图在htk 3.4中找到我将要修改的文件,以便我可以直接读取后置探针的序列,用于语音/单声道的话语,并直接将它们转发到解码器,同时提供声学和语言模型。

更详细一点,我正在关注HTK教程并包括第9步,我只是想研究单声道。我(自己的,特定的)特征向量是具有每个音素的3种状态的概率的向量序列,类似于

(p(aa_begin),p(aa_mid),p(aa_end),...,p(z_begin),p(z_mid),p(z_end))

对于话语中的每一帧,如上所述,条目已经是后验点。

知道我需要修改哪些文件来读取我的(特定)文件(自己的二进制格式)以及如何直接将它们转发到解码器?最好让我可以使用HVite& HEResult得到结果?

非常感谢你的帮助, -G。

1 个答案:

答案 0 :(得分:0)

我认为HVite上的选项-f将以您希望的方式呈现结果。 这是我发送的命令:

  

./ HVite -T 1 -f -b sil -C config -a -H model / hmm7 / macros -H model / hmm7 / hmmdefs -i word1.mlf -m -t 250.0 -y lab -I word。 mlf -S train.scp -L label / dict.list phone1.list

这里是文件word1.mlf的开头(s2,s3,s4是每个音素的中心和结尾)

"mfc/dr1_fcjf0_sa1.lab"

0 100000 s2 -48.580540 sil -1204.165527 sil

100000 400000 s3 -158.456665

400000 1900000 s4 -997.128357

1900000 2000000 s2 -75.405327 SH -530.110291 SHE

2000000 2500000 s3 -306.394897

2500000 2700000 s4 -148.310074

2700000 3000000 s2 -252.779510 IY -796.414673

3000000 3300000 s3 -214.586655

3300000 3700000 s4 -329.048492