我目前正在研究Naive Bayes分类的多项模型,并且遇到了以下示例:
我想我理解了一切,但我已经提出了以下我想要确认的推理:
对于给定的类c,文档d由术语t1,t2,...,tn组成。这是如何计算P(c | d):
P(class | doc):( previous [c])*(prob [t1 in c])*(prob [t2 in c])* ... *(prob [tn in c])
P(!class | doc):( previous [!c])*(prob [t1 in!c])*(prob [t2 in!c])* ... *(prob [tn in!c])
这是对的吗?因此,这是功率3出现在(3/7)和(2/9)中的原因,表示P(中文| c)和P(中文|!c)以及“中文”出现的事实在d5中三次?
提前谢谢你。