我面临的分类问题似乎适用于朴素贝叶斯分类器(NBC)。但是,我有一个问题:通常NBC根据随机变量X的观察x估计出一组C类中最可能的C类。
在我的情况下,我有多个变量X1,X2可能会或可能不会共享功能。变量X1可以具有特征(xa,xb,xc),X2可以具有(xc,xd),而另一个变量X3可以具有(xe)。是否有可能构建一个分类器,允许我同时对X1,X2和X3进行分类,尽管这些特征是相交的甚至是正交的?
可以从另一个角度来看待问题:对于某些类,我缺少某些功能中的所有数据。请考虑以下表格:
Classes = {C1,C2}。
特征= X = {X1,X2,X3},X1 = {A,B},X2 = {1,2},X3 = {Y,N}
C1类:
X1 X2 X3 #observations
A 1 ? 50
A 2 ? 20
B 1 ? 20
B 2 ? 10
C2类:
X1 X2 X3 #observations
A 1 Y 20
A 1 N 0
A 2 Y 20
A 2 N 10
B 1 Y 10
B 1 N 20
B 1 Y 10
B 1 N 10
正如您所看到的,功能X3与C1类没有任何关系。在对C1类进行分类时,没有可用于功能X3的数据。我可以制作一个分类器,将X =(A,2,N)分为C1和C2吗?如何计算C1类中X3缺失数据的条件概率?