Question

我的任务如下：我需要从头开始以数据帧的形式构建几个表。特别是，每个表对于每个标识符总是相同的（摘要统计表的排序）。例如：

 result= {'Value':[mean_t,mean_t_1,mean_diff_lev, mean_diff_log],
             'T-stat':[np.NaN,np.NaN,t_diff_lev, t_diff_log],
             'Type':['XL','XL','XL', 'XL']}
 result=pd.DataFrame.from_dict(result,orient='index',
                                  columns=['Square_t','Square_t_1',
                                           'Mean diff','Mean diff log'])

因此得到了我

        Square_t Square_t_1 Mean diff Mean diff log
Value   502.123    533.324  -31.2018    -0.0567523
T-stat      NaN        NaN  -3.33098      -5.38749
Type         XL         XL        XL            XL

我有一个函数，可以计算在那里使用的所有值，最后，它根据值字典创建上面给出的数据框。我需要设置一个由两个部分组成的多重索引：第一个（或外部）一个是标识符（例如“ Roger”），第二个（或内部）是我已经拥有的，即列表{ {1}}。结果应如下所示：

['Value','T-Stat'.'Type']

或者这个：

             Square_t Square_t_1 Mean diff Mean diff log
Roger Value   502.123    533.324  -31.2018    -0.0567523
      T-stat      NaN        NaN  -3.33098      -5.38749
      Type         XL         XL        XL            XL

目标是能够通过附加或连接具有不同ID的不同数据帧来构建更大的数据帧。

Answer 1

我自己找到了答案。最简单的方法是使用pandas方法concat。与其为每个ID创建具有多索引的数据框，不如为每个单个ID创建不带ID的数据框，然后创建所有数据框，并在跟踪列表中的各种ID之后，我们可以简单地将所有单个ID串联起来数据帧。假设我们有两个df1,df2类型的数据框：

        Square_t Square_t_1 Mean diff Mean diff log
Value   502.123    533.324  -31.2018    -0.0567523
T-stat      NaN        NaN  -3.33098      -5.38749
Type         XL         XL        XL            XL

ID ['Roger','Kyle']。我们运行：

pd.concat([df1,df2],keys=['Roger','Kyle'])

结果确实是一个多索引数据帧：

              Square_t Square_t_1 Mean diff Mean diff log
Roger  Value   430.855    454.733  -23.8778    -0.0492182
       T-stat      NaN        NaN  -3.48394      -5.37168
       Type         XL         XL        XL            XL
Kyle   Value   721.824     735.67   -13.846    -0.0192327
       T-stat      NaN        NaN  -1.93132      -2.74519
       Type         XL         XL        XL            XL

pd.concat([df1,df2],keys=['Roger','Kyle']),index

MultiIndex([('Roger',  'Value'),
            ('Roger', 'T-stat'),
            ('Roger',  'Type'),
            ( 'Kyle',  'Value'),
            ( 'Kyle', 'T-stat'),
            ( 'Kyle',  'Type')],
           )

从头开始设置特定的多索引

1 个答案: