朴素贝叶斯:观察变量的异质CPD

时间:2015-02-20 15:38:18

标签: binary classification probability naivebayes

我使用naives bayes模型进行二元分类,使用离散和连续变量的组合。我的问题是,我可以对连续和离散观测变量使用不同的条件概率分布(CPD)函数吗? 例如,我将高斯CPD用于离散变量的连续和一些确定性CPD?

谢谢

1 个答案:

答案 0 :(得分:0)

是的,在同一模型中混合连续变量和离散变量是正常的。请考虑以下示例。

假设我有两个随机变量:

  • T - 今天的温度
  • D - 星期几

注意T是连续的,D是离散的。假设我想预测约翰是否会去海滩,由二进制变量B表示。然后我可以设置我的推理如下,假设T和D在条件上独立给定B。

           p(T|B) • p(D|B) • p(B)
p(B|T,D) = ━━━━━━━━━━━━ ∝ p(T|B) • p(D|B) • p(B)
                p(T) • p(D)

p(T | B)可以是高斯分布,p(D | B)可以是离散分布,而p(B)可以是约翰前往海滩的频率的离散先验。