Question

我如何分配＆＃34; custom＆＃34;在scikit的朴素贝叶斯分类器中贝叶斯规则的先验概率？

为简单起见，我们以Iris数据集为例，其中我们有150个样本和3个不同的类，每个类有50个样本。我假设默认值将根据输入数据（并取决于训练数据集的重新采样方式）分配p（c_i）= ~0.33的先验概率。
但是，如果我有一些额外的知识，并且知道花卉课程1在“现实”中出现的频率更高，那么不同课程的先验将是

p（c = 1）= 0.8
p（c = 2）= 0.1
p（c = 3）= 0.1

让我们假设我已经完成了所有的预处理（专长选择，标准化/标准化，暗淡减少等），并使用朴素贝叶斯分类器（高斯），如下所示：

from sklearn.naive_bayes import GaussianNB

gnb_clf = GaussianNB()
gnb_clf.fit(X_train, y_train)
pred_test = gnb_clf.predict(X_test)

我如何分配我的＆＃34;自定义先验概率＆＃34;？

我看到GaussianNB有一个set_params参数（参见documentation），但是，我不知道如何使用它......

如何在scikit-learn中为Naive Bayes clf手动设置先验概率？

0 个答案: