如果2班有相同的P(c | d),天真的贝叶斯,请选择最好的班级

时间:2014-06-06 08:48:48

标签: classification data-mining text-mining bayesian

你好我对朴素贝叶斯分类器有一些疑问。 在我的项目中,我必须将文本分类为4个可用类中的类。

在幼稚的贝叶斯,我们有像

这样的公式
cmap=argmax.P(d|c).P(c)

我已经对每个班级的培训文档数量进行了标准化,因此我为每个班级(0.25)获得了相同的P(c)值。

这是我的问题:如果测试文档令牌没有任何属于这4个类中的任何一个令牌(在文档培训中)怎么办?

导致所有类具有相同的P(d|c).P(c)值。 我应该选哪一堂课?

如果令牌存在,并且2个或更多类具有相同的P(d|c).P(c)值,该怎么办?

谢谢..

1 个答案:

答案 0 :(得分:0)

如果课程后验相同,那应该没关系。

作为一个打破平局,你可以选择较高级别的班级,即更频繁的班级。

但是你的贝叶斯分析只是表明你猜是