从2D数据到具有多索引列的1D的pandas

时间:2017-09-07 15:02:39

标签: python python-3.x pandas

我有一个带索引和列的简单2D数据帧。我需要使用我的同事的布局将其导出到excel文件,例如具有2个级别的多索引列的单行。第一级对应于我的数据框索引,第二级对应于我的数据框列。

我有什么:

          Ah-Step    Wh-Step     T[°C]
C-Rate                                
1C     -30.133791 -63.016814  30.86355
2C     -25.557269 -51.937002  37.10111
3C     -20.338776 -40.632206  43.84840
4C      -8.023851 -16.609749  45.63529
5C      -3.868425  -8.111969  46.74843

我想要的是什么:

          1C                              2C                              3C  \
     Ah-Step    Wh-Step     T[°C]    Ah-Step    Wh-Step     T[°C]    Ah-Step   
0 -30.133791 -63.016814  30.86355 -25.557269 -51.937002  37.10111 -20.338776   

                             4C                             5C            \
     Wh-Step    T[°C]   Ah-Step    Wh-Step     T[°C]   Ah-Step   Wh-Step   
0 -40.632206  43.8484 -8.023851 -16.609749  45.63529 -3.868425 -8.111969   


      T[°C]  
0  46.74843  

到目前为止我的解决方案(我的数据框由'Summary'变量保存,'writer'用于导出到excel):

m_cols = pd.MultiIndex.from_product([Summary.index.tolist(),
                            Summary.columns.tolist()])
df = pd.DataFrame(data=pd.np.zeros((1,15)),
                  columns=m_cols)
for c in Summary.index:
    for k in Summary.columns:
        df[c,k].iloc[0] = Summary.loc[c,k]
df.to_excel(writer,sheet_name='Summary')

我的解决方案缺乏对变革的抵制,并不优雅。

是否有嵌入式方法可以在没有for循环的情况下执行此类操作并使用零预先分配行?

2 个答案:

答案 0 :(得分:4)

您可以使用stack将列索引移动到新的行索引级别:

In [61]: df.stack()
Out[61]: 
C-Rate         
1C      Ah-Step   -30.133791
        T[°C]      30.863550
        Wh-Step   -63.016814
2C      Ah-Step   -25.557269
        T[°C]      37.101110
        Wh-Step   -51.937002
3C      Ah-Step   -20.338776
        T[°C]      43.848400
        Wh-Step   -40.632206
4C      Ah-Step    -8.023851
        T[°C]      45.635290
        Wh-Step   -16.609749
5C      Ah-Step    -3.868425
        T[°C]      46.748430
        Wh-Step    -8.111969
dtype: float64

在正面,这会自动为您构建MultiIndex。在缺点方面,这是一个系列,而不是一个DataFrame,它是垂直方向,而不是水平方向。要解决此问题,请致电to_frame,然后转置:

import pandas as pd
df = pd.DataFrame({'Ah-Step': [-30.133791, -25.557269, -20.338776, -8.023850999999999, -3.868425], 'T[°C]': [30.86355, 37.10111, 43.8484, 45.635290000000005, 46.74843], 'Wh-Step': [-63.016814000000004, -51.937002, -40.632206, -16.609749, -8.111969]}, index=pd.Series(['1C', '2C', '3C', '4C', '5C'], name='C-Rate')) 
result = df.stack().to_frame().T
print(result)

产量

C-Rate         1C                              2C                       \
          Ah-Step     T[°C]    Wh-Step    Ah-Step     T[°C]    Wh-Step   
0      -30.133791  30.86355 -63.016814 -25.557269  37.10111 -51.937002   

C-Rate         3C                            4C                       \
          Ah-Step    T[°C]    Wh-Step   Ah-Step     T[°C]    Wh-Step   
0      -20.338776  43.8484 -40.632206 -8.023851  45.63529 -16.609749   

C-Rate        5C                      
         Ah-Step     T[°C]   Wh-Step  
0      -3.868425  46.74843 -8.111969  

答案 1 :(得分:0)

或使用unstack

 df.T.unstack().to_frame().T
    Out[139]: 
    C-Rate         1C                              2C                       \
              Ah-Step    Wh-Step     T[°C]    Ah-Step    Wh-Step     T[°C]   
    0      -30.133791 -63.016814  30.86355 -25.557269 -51.937002  37.10111   
    C-Rate         3C                            4C                       \
              Ah-Step    Wh-Step    T[°C]   Ah-Step    Wh-Step     T[°C]   
    0      -20.338776 -40.632206  43.8484 -8.023851 -16.609749  45.63529   
    C-Rate        5C                      
             Ah-Step   Wh-Step     T[°C]  
    0      -3.868425 -8.111969  46.74843