3个图表(i),(ii),(iii)显示具有2个数字属性(x和y轴)的训练集和具有两个类(圆形和方形)的目标属性。
我现在想知道数据挖掘算法(最近邻,朴素贝叶斯和决策树)如何解决每个分类问题。
我认为朴素贝叶斯(天真地假设属性是不相关的)比(i)和(iii)更好地解决了第二个问题,因为这里的数值属性往往更加独立彼此。
还有其他想法吗? THX。
答案 0 :(得分:9)
如果您想在这种情况下使用每种给定的方法:
使用决策树方法可以最好地解决第一个方法,cos类可以按轴分开。我的意思是在x轴上绘制一条垂直线,将值分为左侧和右侧,并在y轴上绘制另一条线,这样您就可以看到类很好地分开了。
如上所述,第二个可被视为朴素贝叶斯问题。
第三个可以通过 k最近邻区方法解决。方形类位于坐标系的近位置,圆类也可以归类为一些错误。