比方说,我的数据集中有5个要素,其中4个是分类的,其中之一是连续的。对于我的分类特征,我假设它们具有多noulli分布,对于我的连续特征,我假设它们具有高斯分布。
我对行的最终概率函数只是每个特征的所有概率的乘积。
为阐明我要完成的工作,以下是一些示例“代码”:
sklearn.naive_bayes
.fit(columns_distributions =
{'colA': Multinomial, 'colContinuous': Gaussian, ...}, data = data)
有什么办法可以使用sklearn做到这一点吗?