在python中创建新的排名列,或使用排序和重置索引排名 - 如何?

时间:2013-12-09 21:08:37

标签: python pandas rank

我正在尝试根据'a'中的值创建排名列(降序)以创建'排名' 下面是我排序后得到的内容,但是现在我有索引作为我想要的列,我的列'rank'如何使用index创建一个新变量?

还是有一个函数rank(),我可以在python中轻松使用它来根据列'a'进行降序排序吗?

df = DataFrame(rand(10, 2), columns=list('ab'))
df.sort('a',ascending = False).reset_index()
# df.reset_index()

1 个答案:

答案 0 :(得分:4)

使用系列rank方法:

In [11]: df.a.rank()
Out[11]: 
0     4
1     1
2     8
3    10
4     6
5     2
6     3
7     9
8     7
9     5
Name: a, dtype: float64

它有一个相应的升序论证:

In [12]: df.a.rank(ascending=False)
Out[12]: 
0     7
1    10
2     3
3     1
4     5
5     9
6     8
7     2
8     4
9     6
Name: a, dtype: float64

在关系的情况下,这将取平均排名,您也可以选择min,max或first:

In [21]: df = pd.DataFrame(np.random.randint(1, 5, (10, 2)), columns=list('ab'))

In [22]: df
Out[22]: 
   a  b
0  2  2
1  3  4
2  1  1
3  3  1
4  4  2
5  2  4
6  1  4
7  2  1
8  1  2
9  3  4

In [23]: df.a.rank()  # there are several 2s (which have rank 5)
Out[23]: 
0     5
1     8
2     2
3     8
4    10
5     5
6     2
7     5
8     2
9     8
Name: a, dtype: float64

In [24]: df.a.rank(method='first')
Out[24]: 
0     4
1     7
2     1
3     8
4    10
5     5
6     2
7     6
8     3
9     9
Name: a, dtype: float64