使用SRILM进行ARPA模型培训时出错

时间:2016-07-20 14:09:23

标签: speech-recognition cmusphinx sphinx4 language-model srilm

我已经按照this教程。

运行此代码后:

ngram-count -kndiscount -interpolate -text train-text.txt -lm your.lm

它给了我这个错误:

  

"修改后的KneserNey折扣之一是折扣中的负误差   订单2的估算器。"

我该如何解决这个问题?

1 个答案:

答案 0 :(得分:1)

-kndiscount有两种可能性给你一个错误:

  1. 您的dataset很小。
  2. dataset中的您的语言很小,这是使用ngram进行正确kndiscount培训的障碍。
  3. 解决方案可能是:

    1. 创建一个更大的dataset
    2. 使用其他折扣技术。
    3. 供参考看一下这个帖子: https://sourceforge.net/p/cmusphinx/discussion/help/thread/97ae0e5c/#a760