我该如何调整这个数据框索引?

时间:2018-06-14 11:27:57

标签: pandas dataframe nat

我有一个数据框,其中包含一个包含日期的列,每天有四个读数,如下所示:

Date       Readings         Values

2016-05-16 Reading 1         0.1
Nat        NaN (Reading 2)   0.1
Nat        Std               0
Nat        Mean              0.1
2016-05-17 ''                0.5
Nat

我想知道如何创建一个multiindex,在同一日期和阅读类型下对4个值进行分组,忽略NaT值。

1 个答案:

答案 0 :(得分:0)

似乎首先需要Date列的前向填充值,然后MultiIndex需要set_index

df['Date'] = df['Date'].ffill()

df = df.set_index(['Date', 'Readings'])
print (df)
                            Values
Date       Readings               
2016-05-16 Reading 1           0.1
           NaN (Reading 2)     0.1
           Std                 0.0
           Mean                0.1
2016-05-17 ''                  0.5

它正常工作,因为如果重复,则会重复所有MultiIndex值:

with pd.option_context('display.multi_sparse', False):
    print (df)

                            Values
Date       Readings               
2016-05-16 Reading 1           0.1
2016-05-16 NaN (Reading 2)     0.1
2016-05-16 Std                 0.0
2016-05-16 Mean                0.1
2016-05-17 ''                  0.5