在CMU SPHINX中调整语言权重(LW)和单词插入惩罚(WIP)

时间:2014-11-25 13:19:10

标签: performance speech-recognition cmusphinx decoder

调整sphinx 3的LW和WIP参数以及在什么时候停止调整的正确方法是什么?

到目前为止,我一直在使用这些步骤,

  • 由于解码器对LW更敏感,因此首先使用默认WIP为0.7来调整解码器以获得最高的字准确度。根据sphinx文档,LW必须在6到13之间调整。

  • 现在调整WIP以保持上面获得的LW,直到插入与删除匹配。此时,解码字的总数将等于地面实况的总数,这是理想解码器所期望的。根据sphinx文档,WIP应该在0.2和0.7

  • 的范围内进行调整

对于我发现最佳LW为10的开发数据集,我永远无法实现与在0.02到0.7范围的WIP中删除相等的插入。我只使用2e22的WIP才达到这一点!这是超出范围的方式。

1 个答案:

答案 0 :(得分:0)

对于如此高的WIP,它肯定不会那么高。您的数据集可能存在问题,也许您在那里有很多沉默,最好将沉默概率调整为更高的值,否则它会尝试将沉默与单词匹配,因此您需要更多的单词插入惩罚来惩罚这些单词。您始终可以选择共享测试集,以获得准确性方面的帮助。