我如何分配" custom"在scikit的朴素贝叶斯分类器中贝叶斯规则的先验概率?
为简单起见,我们以Iris数据集为例,其中我们有150个样本和3个不同的类,每个类有50个样本。我假设默认值将根据输入数据(并取决于训练数据集的重新采样方式)分配p(c_i)= ~0.33的先验概率。
但是,如果我有一些额外的知识,并且知道花卉课程1在“现实”中出现的频率更高,那么不同课程的先验将是
p(c = 1)= 0.8
p(c = 2)= 0.1
p(c = 3)= 0.1
让我们假设我已经完成了所有的预处理(专长选择,标准化/标准化,暗淡减少等),并使用朴素贝叶斯分类器(高斯),如下所示:
from sklearn.naive_bayes import GaussianNB
gnb_clf = GaussianNB()
gnb_clf.fit(X_train, y_train)
pred_test = gnb_clf.predict(X_test)
我如何分配我的"自定义先验概率"?
我看到GaussianNB有一个set_params
参数(参见documentation),但是,我不知道如何使用它......