具有交叉/正交特征集的朴素贝叶斯分类器?

时间:2015-07-09 14:23:01

标签: statistics classification naivebayes

我面临的分类问题似乎适用于朴素贝叶斯分类器(NBC)。但是,我有一个问题:通常NBC根据随机变量X的观察x估计出一组C类中最可能的C类。

在我的情况下,我有多个变量X1,X2可能会或可能不会共享功能。变量X1可以具有特征(xa,xb,xc),X2可以具有(xc,xd),而另一个变量X3可以具有(xe)。是否有可能构建一个分类器,允许我同时对X1,X2和X3进行分类,尽管这些特征是相交的甚至是正交的?

可以从另一个角度来看待问题:对于某些类,我缺少某些功能中的所有数据。请考虑以下表格:

Classes = {C1,C2}。
特征= X = {X1,X2,X3},X1 = {A,B},X2 = {1,2},X3 = {Y,N}

C1类:

X1    X2    X3  #observations
 A     1     ?         50  
 A     2     ?         20  
 B     1     ?         20  
 B     2     ?         10  

C2类:

X1    X2    X3  #observations
 A     1     Y         20  
 A     1     N         0  
 A     2     Y         20  
 A     2     N         10  
 B     1     Y         10  
 B     1     N         20  
 B     1     Y         10  
 B     1     N         10  

正如您所看到的,功能X3与C1类没有任何关系。在对C1类进行分类时,没有可用于功能X3的数据。我可以制作一个分类器,将X =(A,2,N)分为C1和C2吗?如何计算C1类中X3缺失数据的条件概率?

0 个答案:

没有答案