我遇到的问题是,向多索引列DataFrame添加新列会导致新列追加到DataFrame的末尾。 E.g:
Group 1 | Group 2 | Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | Sub 1 | Sub 2 | New Sub | New Sub |
而我想要的是:
Group 1 | Group 2 |
------------------------------------------------------
Sub 1 | Sub 2 | New Sub | Sub 1 | Sub 2 | New Sub |
有没有办法重新分组/订购我的多索引来执行此操作?注意 - 我不想按名称重新排序子组,因为New Sub需要在末尾进行,并且按字母顺序排列可能无法正确排序。
答案 0 :(得分:3)
我认为您需要自定义list
reindex
或reindex_axis
:
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('C','R', 'A'),(1,2))),
data=np.arange(6).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('C','3'),('R',5),('A',4))),
data=[[9,9,4]])
df=df1.join(df2)
print (df)
C R A C R A
1 2 1 2 1 2 3 5 4
0 0 1 2 3 4 5 9 9 4
df1 = df.reindex(columns = ['C','R','A'], level=0)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4
df1 = df.reindex_axis(['C','R','A'], level=0, axis=1)
print (df1)
C R A
1 2 3 1 2 5 1 2 4
0 0 1 9 2 3 9 4 5 4
答案 1 :(得分:2)
您只需在设置后调用df.sort_index:
df1=pd.DataFrame(columns=pd.MultiIndex.from_product((('a','b'),
(1,2))),data=np.arange(4).reshape(1,-1))
df2=pd.DataFrame(columns=pd.MultiIndex.from_tuples((('a','3'),('b',5))),data=[[9,9]])
df=df1.join(df2)
# a b a b
# 1 2 1 2 3 5
# 0 0 1 2 3 9 9
df.sort_index(axis=1,inplace=True)
# a b
# 1 2 3 1 2 5
# 0 0 1 9 2 3 9