Question

因此，首先我对标签进行了排序，例如40个标签为A的行，然后是其他40个标签为B的行，40个标签为C的行，然后是40个标签为D的行。所有这些按此顺序构成了160个标签列表。

使用两个标签（随机和非随机）预测后的

这是我的分数：

shuffled:
0.14375

not shuffled:
0.30434782608695654

我的问题是：两者不应该都一样吗？还是这很正常，我没弄错吗？

Answer 1

在很多情况下，更改训练输入的顺序时，结果都可能会更改。

关于最近邻居算法，如果两个邻居k + 1和 k具有相同的距离，但标签不同，结果将是取决于训练数据的顺序。

其他算法将使用前几点进行入门，这可能会改变结果。

即使您不更改输入顺序，其他命令也会在重新运行时给出不同的结果。许多机器学习算法使用随机数-这会使结果略有不同。值得进行几次跑步，并在发生这种情况时给出平均值。