x和y轴在此散点图中具有不同的比例。 假设每个形状的中心是数据点。
问:使用此训练集对9最近邻分类器的测试点进行分类,使用这两种功能?
问:在页面顶部的散点图中,按任意顺序,将左下角未知点的三个最近邻居的类命名为,使用这两个特征来计算距离。
这是我的尝试:
1:在这种情况下,K越高,每个预测中的选民越多,因此对异常值的抵抗力越强。较大的K值将具有更平滑的决策边界来决定Pet或Wild,这意味着方差更小但偏差更大。
2:通过使用毕达哥拉斯定理,三个最近的类到左下方未知点的距离是,
因此,该课程为Pet。
答案 0 :(得分:1)
问题1询问您未提供的具体答案(宠物或野生)。您所做的陈述通常是正确的,但他们实际上并没有回答这个问题。请注意,只有4个Pet点,其余为Wild。所以无论哪个9点是最近的邻居,至少有5个(大多数)是Wild。因此,K = 9的KNN分类器将始终使用此数据预测Wild。
问题2看起来大多是正确的。我没有准确的坐标坐标,但你的数字似乎在正确的球场,除了你可能在第一个距离有一个拼写错误。这些类是正确的,结果预测(问题没有明确要求)也是正确的(假设K = 3)。