Bi-Gramm模型的良好平顺平滑

时间:2019-02-03 16:46:58

标签: nlp smoothing turing

想象一下,我有一个文本语料库,并且已经计算出Unigram和Bigram的频率。 现在,我要预测p(read|Alice)。 因此:#(Alice, read)/#(Alice)。 #代表频率。

没有#(Alice, read)为零,因此我正在使用良好的Turing平滑来为未发生的事件计算c

现在有了c,我可以只做c/#(Alice)还是要调整#(alice)的频率?

谢谢

0 个答案:

没有答案