标签: r classification knn
我已使用R的底数中的knn来预测观察的类别。有46个变量是二进制编码的,我增加了一些小噪音。当我设置k = 1时,总是得到第一个标签作为预测值。我已经使用dist()函数检查了距离,并且训练数据集中还有其他一些观测值,它们与测试的欧氏距离较小。无论我将哪个标签放在火车上的第一个(顺序),当k = 1时,它都会作为预测标签返回。 知道为什么会这样吗?
knn
dist()