我正在处理cmusphinx语音到文本,我需要训练/添加单词到我的字典,所以我使用lmtool并上传了一个语料库文件并使用.dict和.lm文件并将它们用作参数pocketsphinx,它的工作原理。我想知道如何将这些文件添加到默认文件。即我想将新单词.dict和.lm文件添加到/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict
和/edu/cmu/sphinx/models/en-us/en-us.lm.bin
我不确定,如果这是可行的,我想知道如何将字典组合成单一字典。我发现了这个link但不知道如何实现同样的目标。
当我使用TranscriberDemo.java时,我的wav文件有不同的单词,输出打印不同。如何提高准确度?