根据日期间隔按时间序列填充数据

时间:2018-11-28 12:21:22

标签: python pandas time-series

我有这个数据框:

           ds  Value
0  2017-03-31   3395
1  2017-04-30   4510
3  2017-05-31   2335
5  2017-06-30   6061
6  2017-07-31   4711
7  2017-08-31   3039

我想定义一个日期间隔,以用零填充其他行。

例如:

  • 时间间隔 = '2017-01-31' / '2017-10-31'

预期结果:

           ds  Value
0  2017-01-31   0
0  2017-02-28   0
0  2017-03-31   3395
1  2017-04-30   4510
3  2017-05-31   2335
5  2017-06-30   6061
6  2017-07-31   4711
7  2017-08-31   3039
8  2017-08-31   0
9  2017-08-31   0

我尝试使用以下内容:

 df.reindex(pd.period_range(2017-01, 2017-10, freq='M'), fill_value=0)

但是我得到以下输出:

ds  Value
2017-01 1970-01-01      0
2017-02 1970-01-01      0
2017-03 1970-01-01      0
2017-04 1970-01-01      0
2017-05 1970-01-01      0
2017-06 1970-01-01      0
2017-07 1970-01-01      0
2017-08 1970-01-01      0
2017-09 1970-01-01      0
2017-10 1970-01-01      0
2017-11 1970-01-01      0
2017-12 1970-01-01      0
2018-01 1970-01-01      0
2018-02 1970-01-01      0
2018-03 1970-01-01      0
2018-04 1970-01-01      0
2018-05 1970-01-01      0
2018-06 1970-01-01      0
2018-07 1970-01-01      0

1 个答案:

答案 0 :(得分:2)

使用reindex创建DatetimeIndexdate_range

df = (df.set_index('ds')
        .reindex(pd.date_range('2017-01-31', '2017-10-31', freq='M'), fill_value=0))
print (df)
            Value
2017-01-31      0
2017-02-28      0
2017-03-31   3395
2017-04-30   4510
2017-05-31   2335
2017-06-30   6061
2017-07-31   4711
2017-08-31   3039
2017-09-30      0
2017-10-31      0

如果要使用句点-将DatetimeIndex to_periodreindex转换为period_range

df = (df.set_index('ds')
        .to_period('M')
        .reindex(pd.period_range('2017-01', '2017-10', freq='M'), fill_value=0))
print (df)
         Value
2017-01      0
2017-02      0
2017-03   3395
2017-04   4510
2017-05   2335
2017-06   6061
2017-07   4711
2017-08   3039
2017-09      0
2017-10      0