有人可以解释句子开头单词的概率是如何计算的吗?

时间:2020-05-21 11:18:30

标签: nlp n-gram

enter image description here

大家好,我正在尝试计算句子“我想要中国菜”的可能性,我成功了,但这仅是因为在该表下已指出P(I |)属于自己。我似乎无法理解0.25是如何计算的。有人可以将我推向正确的方向吗?谢谢!

1 个答案:

答案 0 :(得分:1)

通常,您会在句子的开头和结尾处使用一个虚拟字符,并使用该二元数来计算概率。我注意到他们正在使用<s>,如表格下方的公式所示。

在表本身中将其省略,因此您不能仅从那里获得它。

句子的结尾标记有</s>,因此 food 是句子中最后一个单词的概率为0.68,尽管在典型的句子中将是句号。 / p>