增加cmu sphinx中的语言模型大小

时间:2013-01-28 08:27:31

标签: java cmusphinx

您好我正在使用Windows XP中的cmu sphinx。我已经按照sphinx的建议创建了语言模型,当我尝试给出与语言模型相对应的语音样本时,它的工作正常。但是当我在语言模型中有更多文本并输入相应的语音样本作为输入时,cmu无法检测到单词,并且它继续使用创建语言模型的参考文本的前100行中的单词,任何人都可以帮助我克服这个问题。

提前致谢

G Charan

1 个答案:

答案 0 :(得分:0)

AFAIR n-gram语言模型文件在给定N之前存储第一行中每个N-gram类型的行数。因此,您必须自己修改数字以适合模型中的数据量。它应该是这样的:

[100]
iaeug
asedrgkjh
3eirghb
aeirf
iajedf
...