我有一个未排序的数据框。我希望按降序排列A
,B
,C
和D
列(从大到小),但它们必须保留在面额组中。例如,它应按列A
,B
,C
和D
对面额100进行排序,因此行0,1,2更改为0,2,1。
Index Denomination A B C D
0 100 5 0 0 0
1 100 0 0 1 0
2 100 0 2 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
6 200 10 0 0 0
7 200 0 2 1 0
8 200 0 0 2 0
排序级别的顺序必须是A
,B
,C
,然后是D
。重新标记Index
并不重要。
结果数据框应为:
Index Denomination A B C D
0 100 5 0 0 0
2 100 0 2 0 0
1 100 0 0 1 0
6 200 10 0 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
7 200 0 2 1 0
8 200 0 0 2 0
这可以通过选择行然后应用自定义排序在excel中完成,但我需要使用数据帧在python中完成。
答案 0 :(得分:3)
这应该这样做:
df.sort_values(by=['Denomination', 'A', 'B', 'C', 'D'],
ascending=[True, False, False, False, False])
Out:
Denomination A B C D
0 100 5 0 0 0
2 100 0 2 0 0
1 100 0 0 1 0
6 200 10 0 0 0
3 200 5 2 0 0
4 200 5 0 1 0
5 200 0 4 0 0
7 200 0 2 1 0
8 200 0 0 2 0
按Denomination
按升序排序;如果是关系,它按A
按降序排序;如果是关系,它按B
按降序排序等等。
如果“名称”列不应该排序,但应按照组的外观顺序保留,则可以执行以下操作:
df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index)
Out:
0 0
1 0
2 0
3 3
4 3
5 3
6 3
7 3
8 3
Name: Denomination, dtype: int64
这将返回一个新列以跟踪组。您可以将此列添加到DataFrame,它可以具有最高优先级。
(df.assign(denomination_group =
df.groupby('Denomination')['Denomination'].transform(pd.Series.first_valid_index))
.sort_values(by=['denomination_group', 'A', 'B', 'C', 'D'],
ascending=[True, False, False, False, False])
.drop('denomination_group', axis=1))