Pandas DataFrame Multiindex reindex列不起作用

时间:2016-10-20 11:56:17

标签: python pandas dataframe reindex

我有一个带有MultiIndex的DataFrame,用于填充列。

ipdb> actions
flow                    inflow  outflow                   
action              Investment    Trade ExternalFee    Fee
date       sequence                                       
2016-10-18 50          15000.0      NaN         NaN    NaN
           55              NaN      NaN      -513.0    NaN
           60              NaN -14402.4         NaN    NaN
           70              NaN      NaN         NaN -14.29

我希望重新编制索引,从而添加'收入'列。

ipdb> actions.reindex(columns=['Investment', 'Trade', 'ExternalFee', 'Fee', 'Income'], level=1)
flow                    inflow  outflow                   
action              Investment    Trade ExternalFee    Fee
date       sequence                                       
2016-10-18 50          15000.0      NaN         NaN    NaN
           55              NaN      NaN      -513.0    NaN
           60              NaN -14402.4         NaN    NaN
           70              NaN      NaN         NaN -14.29

否'收入'列已添加。

我也试过命名等级:

ipdb> actions.reindex(columns=['Investment', 'Trade', 'Income'], level='action')
flow                    inflow  outflow
action              Investment    Trade
date       sequence                    
2016-10-18 50          15000.0      NaN
           55              NaN      NaN
           60              NaN -14402.4

1 个答案:

答案 0 :(得分:2)

所有列都需要reindex - 所以需要将MultiIndex导出到元组,添加值并使用lastdex:

tuples = actions.columns.tolist()
tuples = tuples + [('outflow','Income')]
print (tuples)
[('inflow', 'Investment'), ('outflow', 'Trade'), 
 ('outflow', 'ExternalFee'), ('outflow', 'Fee'), 
('outflow', 'Income')]

a = actions.reindex(columns=pd.MultiIndex.from_tuples(tuples))
print (a)
                  inflow  outflow                          
              Investment    Trade ExternalFee    Fee Income
2016-10-18 50    15000.0      NaN         NaN    NaN    NaN
           55        NaN      NaN      -513.0    NaN    NaN
           60        NaN -14402.4         NaN    NaN    NaN
           70        NaN      NaN         NaN -14.29    NaN

另一个可行的解决方案是:

actions[('outflow','Income')] = np.nan
print (actions)
action            inflow  outflow                          
date          Investment    Trade ExternalFee    Fee Income
2016-10-18 50    15000.0      NaN         NaN    NaN    NaN
           55        NaN      NaN      -513.0    NaN    NaN
           60        NaN -14402.4         NaN    NaN    NaN
           70        NaN      NaN         NaN -14.29    NaN