如何在scikit-learn中为Naive Bayes clf手动设置先验概率?

时间:2014-08-11 17:03:00

标签: python scikit-learn bayesian

我如何分配" custom"在scikit的朴素贝叶斯分类器中贝叶斯规则的先验概率?

为简单起见,我们以Iris数据集为例,其中我们有150个样本和3个不同的类,每个类有50个样本。我假设默认值将根据输入数据(并取决于训练数据集的重新采样方式)分配p(c_i)= ~0.33的先验概率。
但是,如果我有一些额外的知识,并且知道花卉课程1在“现实”中出现的频率更高,那么不同课程的先验将是

p(c = 1)= 0.8
p(c = 2)= 0.1
p(c = 3)= 0.1

让我们假设我已经完成了所有的预处理(专长选择,标准化/标准化,暗淡减少等),并使用朴素贝叶斯分类器(高斯),如下所示:

from sklearn.naive_bayes import GaussianNB

gnb_clf = GaussianNB()
gnb_clf.fit(X_train, y_train)
pred_test = gnb_clf.predict(X_test)

我如何分配我的"自定义先验概率"?

我看到GaussianNB有一个set_params参数(参见documentation),但是,我不知道如何使用它......

0 个答案:

没有答案