我为文本识别应用创建了一个演讲。为此,我使用CMULanguage工具开发了一个字典。为了为我的项目创建字典,我将两个文件添加到组和文件中的语言文件夹中。文件有扩展名.lm(语言模型)和.dic。
当我上传我的语料库时,CMULanguage工具正在向我提供这些文件。我想知道这个.lm文件的用法是什么?如果有人知道,请告诉我有关此主题的信息。
提前致谢, 克里斯蒂
答案 0 :(得分:0)
字典和语言模型是两个独立的项目 - 你不能将一个转换成另一个,你不能只删除/不提供其中一个 - 两者都需要!
字典用于告诉搜索算法有效单词是什么以及它们与音素/语音转录的关系。
当搜索算法考虑单词过渡时,通过使用单字符,二元语法,n元语法的概率,在识别话语期间使用语言模型。