最近邻,朴素贝叶斯和决策树分类器能解决给定的分类问题有多好?

时间:2013-02-25 14:28:40

标签: machine-learning bayesian decision-tree nearest-neighbor

3个图表(i),(ii),(iii)here显示具有2个数字属性(x和y轴)的训练集和具有两个类(圆形和方形)的目标属性。

我现在想知道数据挖掘算法(最近邻,朴素贝叶斯和决策树)如何解决每个分类问题。

我认为朴素贝叶斯(天真地假设属性是不相关的)比(i)和(iii)更好地解决了第二个问题,因为这里的数值属性往往更加独立彼此。

还有其他想法吗? THX。

1 个答案:

答案 0 :(得分:9)

如果您想在这种情况下使用每种给定的方法:

使用决策树方法可以最好地解决

第一个方法,cos类可以按轴分开。我的意思是在x轴上绘制一条垂直线,将值分为左侧和右侧,并在y轴上绘制另一条线,这样您就可以看到类很好地分开了。

如上所述,

第二个可被视为朴素贝叶斯问题。

第三个可以通过 k最近邻区方法解决。方形类位于坐标系的近位置,圆类也可以归类为一些错误。