我正在尝试根据'a'中的值创建排名列(降序)以创建'排名' 下面是我排序后得到的内容,但是现在我有索引作为我想要的列,我的列'rank'如何使用index创建一个新变量?
还是有一个函数rank(),我可以在python中轻松使用它来根据列'a'进行降序排序吗?
df = DataFrame(rand(10, 2), columns=list('ab'))
df.sort('a',ascending = False).reset_index()
# df.reset_index()
答案 0 :(得分:4)
使用系列rank
方法:
In [11]: df.a.rank()
Out[11]:
0 4
1 1
2 8
3 10
4 6
5 2
6 3
7 9
8 7
9 5
Name: a, dtype: float64
它有一个相应的升序论证:
In [12]: df.a.rank(ascending=False)
Out[12]:
0 7
1 10
2 3
3 1
4 5
5 9
6 8
7 2
8 4
9 6
Name: a, dtype: float64
在关系的情况下,这将取平均排名,您也可以选择min,max或first:
In [21]: df = pd.DataFrame(np.random.randint(1, 5, (10, 2)), columns=list('ab'))
In [22]: df
Out[22]:
a b
0 2 2
1 3 4
2 1 1
3 3 1
4 4 2
5 2 4
6 1 4
7 2 1
8 1 2
9 3 4
In [23]: df.a.rank() # there are several 2s (which have rank 5)
Out[23]:
0 5
1 8
2 2
3 8
4 10
5 5
6 2
7 5
8 2
9 8
Name: a, dtype: float64
In [24]: df.a.rank(method='first')
Out[24]:
0 4
1 7
2 1
3 8
4 10
5 5
6 2
7 6
8 3
9 9
Name: a, dtype: float64