python pandas dataframe将一个colume重命名为multiindex列

时间:2019-12-10 07:28:58

标签: python pandas dataframe

我有以下dataframe

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.random((4,4)))

df
Out[5]: 
          0         1         2         3
0  0.136122  0.948477  0.173869  0.929373
1  0.194699  0.759875  0.723993  0.497966
2  0.323100  0.443267  0.210721  0.681426
3  0.590853  0.710664  0.202502  0.950658

我还有一个列映射器:

mapping = {0: ('1', 'A'), 1: ('1', 'B'), 2: ('2', 'A'), 3: ('2', 'B')}

是否可以使用mappingdf中的列重命名为以下内​​容?即直接通过映射将列更改为多索引。

          1                   2          
          A         B         A         B
0  0.136122  0.948477  0.173869  0.929373
1  0.194699  0.759875  0.723993  0.497966
2  0.323100  0.443267  0.210721  0.681426
3  0.590853  0.710664  0.202502  0.950658

ps,我知道我可以做下面的事情,

df.columns = pd.MultiIndex.from_product([['1','2'],['A','B']])

1 个答案:

答案 0 :(得分:2)

使用Index.map,如果可以使用熊猫0.23+,则忽略.get

df.columns = df.columns.map(mapping.get)
print (df)
          1                   2          
          A         B         A         B
0  0.696469  0.286139  0.226851  0.551315
1  0.719469  0.423106  0.980764  0.684830
2  0.480932  0.392118  0.343178  0.729050
3  0.438572  0.059678  0.398044  0.737995

另一种使用rename的解决方案,但有必要在下一步将其转换为MultiIndex