计算B和| V |在朴素贝叶斯文本分类

时间:2013-04-20 08:18:33

标签: classification term multinomial

我找到了关于多项式朴素贝叶斯分类器的链接

multinomial naive bayes link

我们如何计算B'|V|

该页面表示它是词汇表中的术语数量。在其示例中,我们如何获得6的{​​{1}}?这是所有学期的计算吗?

  

“chinese”,“beijing”,“shanghai”,“meacao”,“tokyo”,“japan”

还有一个问题,如果新术语出现在测试文档中会怎么样?例如,在doc 6中出现“曼谷”或以前从未出现的任何新词。如何计算新学期的概率?

1 个答案:

答案 0 :(得分:1)

你是对的。这是词汇表中单词的总数,因为词汇表中的单词只能有一个条目。