我正在尝试对时间序列进行重新采样,以在多次迭代中获得一致的数据框形状。
有时候,当我提取数据时,没有任何结果,因此,我尝试对数据框进行重新采样,以在每次发生这种情况时都包含填充,但是我想强制重新采样运行到特定日期。 / p>
我目前的努力包括
df.set_index(df.date, inplace = True)
resampled = df.resample('D').sum()
但是我不确定如何强制重采样器持续到最新日期
我也尝试过:
df.index = pd.period_range(min(older_df.date), max(older_df.date))
但是长度不匹配。
答案 0 :(得分:2)
用reindex
约束重采样:
min_date = df.index.min()
max_date = '2020-01-01' # change your date here
daterange = pd.date_range(min_date, max_date)
df.resample('D').sum().reindex(daterange)