我现在有2种ngram语言模型(model_A
和model_B
)。
ARPA
格式存储,所以我有2个ARPA
文件,ARPA_A
和ARPA_B
。现在,如果我想对它们进行插值,即输入任意短语ABC。
model_C(ABC) = 0.5 * model_A(ABC) + 0.5 * model_B(ABC)
如何将ARPA_A
和ARPA_B
合并为一个(ARPA_C
)?
答案 0 :(得分:0)
是的。可以组合两种ngram语言模型。考虑到您正在使用基于Open fst的Open ngram。
ngrammerge --use_smoothing --normalize --alpha=3 --beta=2 earnest.aa.mod earnest.ab.mod >earnest.merged.mod