分组并填写缺少的日期时间值

时间:2019-12-16 08:35:51

标签: python pandas dataframe datetime machine-learning

我要尝试的是按合同和日期对Pandas Dataframe进行分组,并填写缺少的datetime值。

我的输入是这样

contract         datetime             value1          value2
   x       2019-01-01 00:00:00          50              60
   x       2019-01-01 01:00:00          30              60
   x       2019-01-01 02:00:00          70              80
   y       2019-01-01 00:00:00          30              100

我想做的是为每个合约设置所有可能的日期时间(从00:00:00到23:00:00),并用NaN或None填充缺失值。

非常感谢您。

1 个答案:

答案 0 :(得分:2)

您可以将每个组DataFrame.reindexDataFrame.groupby和lambda函数一起使用:

df['datetime'] = pd.to_datetime(df['datetime'])

f= lambda x: x.reindex(pd.date_range(x.index.min().floor('d'),
                                      .index.max().floor('d')+pd.Timedelta(23, 'H'),freq='H'))
df1 = (df.set_index('datetime')
         .groupby('contract')
         .apply(f)
         .drop('contract', axis=1)
         .reset_index())
print (df1)