你好我对朴素贝叶斯分类器有一些疑问。 在我的项目中,我必须将文本分类为4个可用类中的类。
在幼稚的贝叶斯,我们有像
这样的公式cmap=argmax.P(d|c).P(c)
我已经对每个班级的培训文档数量进行了标准化,因此我为每个班级(0.25)获得了相同的P(c)
值。
这是我的问题:如果测试文档令牌没有任何属于这4个类中的任何一个令牌(在文档培训中)怎么办?
导致所有类具有相同的P(d|c).P(c)
值。
我应该选哪一堂课?
如果令牌存在,并且2个或更多类具有相同的P(d|c).P(c)
值,该怎么办?
谢谢..
答案 0 :(得分:0)
如果课程后验相同,那应该没关系。
作为一个打破平局,你可以选择较高级别的班级,即更频繁的班级。
但是你的贝叶斯分析只是表明你猜是。