如何在语音识别中使用arpa文件

时间:2011-09-11 11:45:04

标签: voice-recognition cmusphinx language-model

我使用CMU SLM工具包从文本文件创建了一个ARPA文件。

目前我不知道如何在我的项目中使用生成的ARPA文件而不是.lm.dic文件。

如果有人知道,请告诉我。

1 个答案:

答案 0 :(得分:3)

在考虑搜索中单词转换的“成本”时,您使用语言模型的概率。 :-)但这可能不是你想听到的。

你的问题太开放了......你的具体问题是什么?

字典和语言模型是两个独立的项目 - 您无法将其转换为另一个。

字典用于告诉搜索有效单词是什么以及它们与音素/语音转录的关系。

当搜索算法考虑单词过渡时,通过使用单字符,二元语法,n元语法的概率,在识别话语期间使用语言模型。

修改

检查:

http://www-speech.sri.com/projects/srilm/manpages/ngram-format.5.html

http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html

http://www.ling.ohio-state.edu/~bromberg/ngramcount/ngram2fsm.html