在带有乱码的标签和不带有标签的precision_score之间使用区别吗?

时间:2019-05-07 14:15:14

标签: python scikit-learn data-science

因此,首先我对标签进行了排序,例如40个标签为A的行,然后是其他40个标签为B的行,40个标签为C的行,然后是40个标签为D的行。所有这些按此顺序构成了160个标签列表。

使用两个标签(随机和非随机)预测后的

这是我的分数:

shuffled:
0.14375

not shuffled:
0.30434782608695654

我的问题是: 两者不应该都一样吗?还是这很正常,我没弄错吗?

1 个答案:

答案 0 :(得分:1)

在很多情况下,更改训练输入的顺序时,结果都可能会更改。

例如,Nearest neighbours警告

  

关于最近邻居算法,如果两个邻居k + 1和   k具有相同的距离,但标签不同,结果将是   取决于训练数据的顺序。

其他算法将使用前几点进行入门,这可能会改变结果。

即使您不更改输入顺序,其他命令也会在重新运行时给出不同的结果。许多机器学习算法使用随机数-这会使结果略有不同。值得进行几次跑步,并在发生这种情况时给出平均值。