我很好奇Python的排名。输出是如何到达的,如下所示? 数据的排名是什么?
Input obj = pd.Series([7,-5,7,4,2,0,4])
输出:
print(obj)
0 7
1 -5
2 7
3 4
4 2
5 0
6 4
排名
print(obj.rank())
0 6.5
1 1.0
2 6.5
3 4.5
4 3.0
5 2.0
6 4.5
答案 0 :(得分:3)
According to the official Pandas Documentation,它会执行以下操作:
计算数值数据沿轴的等级(从1到n)。相等值 被分配的排名是这些值的平均排名
这意味着,基本上所有值都被分配了“高分”。值7最高,因此获得最高排名,但是由于值7两次出现,因此两者都获得了高分7和6。但是,由于值7不能有2个不同的“高分”,因此会为其分配平均值两个排名。 (6 + 7)/ 2是6.5->这是数据值7的排名。其他值更直接,例如-5最低,因此排名最差。