标签: nlp n-gram
大家好,我正在尝试计算句子“我想要中国菜”的可能性,我成功了,但这仅是因为在该表下已指出P(I |)属于自己。我似乎无法理解0.25是如何计算的。有人可以将我推向正确的方向吗?谢谢!
答案 0 :(得分:1)
通常,您会在句子的开头和结尾处使用一个虚拟字符,并使用该二元数来计算概率。我注意到他们正在使用<s>,如表格下方的公式所示。
<s>
在表本身中将其省略,因此您不能仅从那里获得它。
句子的结尾标记有</s>,因此 food 是句子中最后一个单词的概率为0.68,尽管在典型的句子中将是句号。 / p>
</s>