我有一个数据框,其中包含一个包含日期的列,每天有四个读数,如下所示:
Date Readings Values
2016-05-16 Reading 1 0.1
Nat NaN (Reading 2) 0.1
Nat Std 0
Nat Mean 0.1
2016-05-17 '' 0.5
Nat
我想知道如何创建一个multiindex
,在同一日期和阅读类型下对4个值进行分组,忽略NaT值。
答案 0 :(得分:0)
似乎首先需要Date
列的前向填充值,然后MultiIndex
需要set_index
:
df['Date'] = df['Date'].ffill()
df = df.set_index(['Date', 'Readings'])
print (df)
Values
Date Readings
2016-05-16 Reading 1 0.1
NaN (Reading 2) 0.1
Std 0.0
Mean 0.1
2016-05-17 '' 0.5
它正常工作,因为如果重复,则会重复所有MultiIndex
值:
with pd.option_context('display.multi_sparse', False):
print (df)
Values
Date Readings
2016-05-16 Reading 1 0.1
2016-05-16 NaN (Reading 2) 0.1
2016-05-16 Std 0.0
2016-05-16 Mean 0.1
2016-05-17 '' 0.5