按列对数据框中的某些行进行排序

时间:2016-09-11 10:02:50

标签: python sorting pandas dataframe

我有一个未排序的数据框。我希望按降序排列ABCD列(从大到小),但它们必须保留在面额组中。例如,它应按列ABCD对面额100进行排序,因此行0,1,2更改为0,2,1。

Index   Denomination    A   B   C   D
0        100            5   0   0   0
1        100            0   0   1   0
2        100            0   2   0   0
3        200            5   2   0   0
4        200            5   0   1   0
5        200            0   4   0   0
6        200            10  0   0   0
7        200            0   2   1   0
8        200            0   0   2   0

排序级别的顺序必须是ABC,然后是D。重新标记Index并不重要。 结果数据框应为:

Index   Denomination    A   B   C   D
0        100            5   0   0   0
2        100            0   2   0   0
1        100            0   0   1   0
6        200            10  0   0   0
3        200            5   2   0   0
4        200            5   0   1   0
5        200            0   4   0   0
7        200            0   2   1   0
8        200            0   0   2   0

这可以通过选择行然后应用自定义排序在excel中完成,但我需要使用数据帧在python中完成。

1 个答案:

答案 0 :(得分:3)

这应该这样做:

df.sort_values(by=['Denomination', 'A', 'B', 'C', 'D'], 
               ascending=[True, False, False, False, False])
Out: 
   Denomination   A  B  C  D
0           100   5  0  0  0
2           100   0  2  0  0
1           100   0  0  1  0
6           200  10  0  0  0
3           200   5  2  0  0
4           200   5  0  1  0
5           200   0  4  0  0
7           200   0  2  1  0
8           200   0  0  2  0

Denomination按升序排序;如果是关系,它按A按降序排序;如果是关系,它按B按降序排序等等。

如果“名称”列不应该排序,但应按照组的外观顺序保留,则可以执行以下操作:

df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index)
Out: 
0    0
1    0
2    0
3    3
4    3
5    3
6    3
7    3
8    3
Name: Denomination, dtype: int64

这将返回一个新列以跟踪组。您可以将此列添加到DataFrame,它可以具有最高优先级。

(df.assign(denomination_group = 
     df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index))
   .sort_values(by=['denomination_group', 'A', 'B', 'C', 'D'], 
                ascending=[True, False, False, False, False])
   .drop('denomination_group', axis=1))