我使用CMU SLM工具包从文本文件创建了一个ARPA文件。
目前我不知道如何在我的项目中使用生成的ARPA文件而不是.lm
和.dic
文件。
如果有人知道,请告诉我。
答案 0 :(得分:3)
在考虑搜索中单词转换的“成本”时,您使用语言模型的概率。 :-)但这可能不是你想听到的。
你的问题太开放了......你的具体问题是什么?
字典和语言模型是两个独立的项目 - 您无法将其转换为另一个。
字典用于告诉搜索有效单词是什么以及它们与音素/语音转录的关系。
当搜索算法考虑单词过渡时,通过使用单字符,二元语法,n元语法的概率,在识别话语期间使用语言模型。
修改强>
检查:
http://www-speech.sri.com/projects/srilm/manpages/ngram-format.5.html
http://www.ee.ucla.edu/~weichu/htkbook/node243_ct.html
http://www.ling.ohio-state.edu/~bromberg/ngramcount/ngram2fsm.html