K近邻算法的分类

时间:2018-06-01 06:46:24

标签: algorithm knn

x和y轴在此散点图中具有不同的比例。 假设每个形状的中心是数据点。

scatter diagram of for pet, wild and unknown dogs

问:使用此训练集对9最近邻分类器的测试点进行分类,使用这两种功能?

问:在页面顶部的散点图中,按任意顺序,将左下角未知点的三个最近邻居的类命名为,使用这两个特征来计算距离。

这是我的尝试:

1:在这种情况下,K越高,每个预测中的选民越多,因此对异常值的抵抗力越强。较大的K值将具有更平滑的决策边界来决定Pet或Wild,这意味着方差更小但偏差更大。

2:通过使用毕达哥拉斯定理,三个最近的类到左下方未知点的距离是,

  1. 宠物,距离= 0.02
  2. 宠物,距离= 2.20
  3. 野性,距离= 2.60
  4. 因此,该课程为Pet。

1 个答案:

答案 0 :(得分:1)

问题1询问您未提供的具体答案(宠物或野生)。您所做的陈述通常是正确的,但他们实际上并没有回答这个问题。请注意,只有4个Pet点,其余为Wild。所以无论哪个9点是最近的邻居,至少有5个(大多数)是Wild。因此,K = 9的KNN分类器将始终使用此数据预测Wild。

问题2看起来大多是正确的。我没有准确的坐标坐标,但你的数字似乎在正确的球场,除了你可能在第一个距离有一个拼写错误。这些类是正确的,结果预测(问题没有明确要求)也是正确的(假设K = 3)。