朴素贝叶斯文本分类拉普拉斯平滑

时间:2015-07-03 22:10:05

标签: classification bayesian smoothing

我正在尝试实施朴素的贝叶斯分类器,并且确实混淆了拉普拉斯平滑的问题。

在C组中获得单词的概率是:

<pre>  
    P(Wi|C) = (count(Wi,C) + 1) / (count(all, C) + |V|)  
</pre>

但是什么是V?它只是训练语料库的词汇吗?或者V是整个英语词汇?

1 个答案:

答案 0 :(得分:0)

朴素贝叶斯(Naive Bayes)中的拉普拉斯(Laplace)平滑用于维持Bias-方差折衷或过度拟合-拟合问题。

它将超级参数(Alpha)添加到分子和分母字段中。您必须调整此参数以使用GridSearch或RandomSearch技术选择更好的模型。 https://towardsdatascience.com/hyperparameter-tuning-c5619e7e6624