我有一个包含2级列但是1级行的大数据框,我正在尝试按如下方式对其进行排序: 0级:按字母顺序排列; 第1级:自定义排序。
import pandas as pd
dictionary = {'A' : {'M': [1,2,3,4,5],
'L': [6,7,8,9,1],
'F': [3,5,1,3,5] },
'C' : {'M': [2,3,4,5,6],
'L': [7,8,9,1,2],
'F': [0,1,6,3,5] },
'B' : {'M': [1,5,2,5,3],
'L': [9,5,6,3,4],
'F': [6,2,7,1,5] }
}
reform = {(outerKey, innerKey): values for outerKey, innerDict in dictionary.iteritems() for innerKey, values in innerDict.iteritems()}
pd.DataFrame(reform,index=['g','h','i','j','k'])
我当时拥有的是
# A B C
# F L M F L M F L M
# g 3 6 1 6 9 1 0 7 2
# h 5 7 2 2 5 5 1 8 3
# i 1 8 3 7 6 2 6 9 4
# j 3 9 4 1 3 5 3 1 5
# k 5 1 5 5 4 3 5 2 6
如何在级别0上指定列的顺序为A,B,C?在级别1上指定F,M,L?
### OUT
# A B C
# F M L F M L F M L
我尝试使用pd.IndexSlice
和.loc
,但我仍然只按字母顺序排列。
答案 0 :(得分:13)
您可以使用reindex_axis
来实现此目的,这会接受标签arg,axis和level:
In [20]:
df = df.reindex_axis(list('FML'), axis=1, level=1)
df
Out[20]:
A B C
F M L F M L F M L
g 3 1 6 6 1 9 0 2 7
h 5 2 7 2 5 5 1 3 8
i 1 3 8 7 2 6 6 4 9
j 3 4 9 1 5 3 3 5 1
k 5 5 1 5 3 4 5 6 2
感谢@Nickli Maveli,您也可以使用reindex
来实现相同的目标:
In [22]:
df = df.reindex(columns=list('FML'), level=1)
df
Out[22]:
A B C
F M L F M L F M L
g 3 1 6 6 1 9 0 2 7
h 5 2 7 2 5 5 1 3 8
i 1 3 8 7 2 6 6 4 9
j 3 4 9 1 5 3 3 5 1
k 5 5 1 5 3 4 5 6 2
答案 1 :(得分:3)
如果您之后不想更改数据框,可以为pd.DataFrame
构造函数指定一个已定义订单的索引。
columns = pd.Index([('A', 'F'), ('A', 'M'), ('A', 'L'), ('B', 'F'), ('B', 'M'), ('B', 'L'),('C', 'F'), ('C', 'M'), ('C', 'L')])
pd.DataFrame(reform,index=['g','h','i','j','k'], columns=columns)
columns = pd.Index([(level_0, level_1) for level_0 in "ABC" for level_1 in "FML"])
pd.DataFrame(reform,index=['g','h','i','j','k'], columns=columns)
A B C
F M L F M L F M L
g 3 1 6 6 1 9 0 2 7
h 5 2 7 2 5 5 1 3 8
i 1 3 8 7 2 6 6 4 9
j 3 4 9 1 5 3 3 5 1
k 5 5 1 5 3 4 5 6 2