kNN是统计分类器吗?

时间:2016-04-05 10:17:28

标签: algorithm machine-learning classification weka knn

我目前正在为人工智能考试开展机器学习项目。目标是使用WEKA正确选择两种分类算法进行比较,同时要记住这两种算法必须足够不同才能使比较成为理由。此外,算法必须处理标称和数字数据(我想这是必须进行比较)。 例如,我的教授建议选择统计分类器和决策树分类器,或者深入研究自下而上分类器和自上而下分类器之间的比较。

由于我在机器学习领域的经验很少,我正在研究WEKA提供的各种算法,我踩到了kNN,即k-最近邻算法。 这是统计的吗?是否可以与Decision Stump算法进行比较,例如?

或者,你能否提出一些符合我上面指出的这些要求的算法?

P上。 S。:处理数据必须是数字和标称数据。在WEKA上有数字/名义特征和数字/名义等级。我是否必须选择具有数字/名义特征和类别的算法,或者只选择其中一个算法?

我非常感谢任何帮助人员,感谢您的耐心等待!

1 个答案:

答案 0 :(得分:1)

根据您教授的描述,我不会将k-Nearest Neighbors (kNN)视为统计分类器。在大多数情况下,统计分类器是通过训练数据的统计来概括(通过直接使用统计或通过变换它们)。这方面的一个例子是Naïve Bayes Classifier

相比之下,kNN是Instance-Based Learning的一个例子。它不使用训练数据的统计数据;相反,它将新观察直接与训练实例进行比较以进行分类。

关于比较,是的,您可以将kNN的性能与决策树桩(或任何其他分类器)进行比较。由于任何两个监督分类器将产生与您的训练/测试数据相关的分类准确度,您可以比较它们的性能。