因此,首先我对标签进行了排序,例如40个标签为A的行,然后是其他40个标签为B的行,40个标签为C的行,然后是40个标签为D的行。所有这些按此顺序构成了160个标签列表。
使用两个标签(随机和非随机)预测后的这是我的分数:
shuffled:
0.14375
not shuffled:
0.30434782608695654
我的问题是: 两者不应该都一样吗?还是这很正常,我没弄错吗?
答案 0 :(得分:1)
在很多情况下,更改训练输入的顺序时,结果都可能会更改。
例如,Nearest neighbours警告
关于最近邻居算法,如果两个邻居k + 1和 k具有相同的距离,但标签不同,结果将是 取决于训练数据的顺序。
其他算法将使用前几点进行入门,这可能会改变结果。
即使您不更改输入顺序,其他命令也会在重新运行时给出不同的结果。许多机器学习算法使用随机数-这会使结果略有不同。值得进行几次跑步,并在发生这种情况时给出平均值。