我正在尝试实施朴素的贝叶斯分类器,并且确实混淆了拉普拉斯平滑的问题。
在C组中获得单词的概率是:
<pre>
P(Wi|C) = (count(Wi,C) + 1) / (count(all, C) + |V|)
</pre>
但是什么是V?它只是训练语料库的词汇吗?或者V是整个英语词汇?
答案 0 :(得分:0)
朴素贝叶斯(Naive Bayes)中的拉普拉斯(Laplace)平滑用于维持Bias-方差折衷或过度拟合-拟合问题。
它将超级参数(Alpha)添加到分子和分母字段中。您必须调整此参数以使用GridSearch或RandomSearch技术选择更好的模型。 https://towardsdatascience.com/hyperparameter-tuning-c5619e7e6624