我有一个包含资产价格(OHLC资产数据)的数据框,因此其索引为日期时间。数据应在几分钟内完成采样,但我的数据集缺少一些时间。
要填充丢失的数据,我只使用了功能
df.resample("1Min").asfreq()
它可以正确填充一天之内的分钟,但是由于我的数据框包含不同日期的数据,因此通常填充该分钟直到每天的午夜。我希望,如果某一天包含从13:05 pm到20:50 pm的数据,那么它仅在这些时间之间填充分钟,即不要超出这些范围。
我查看了有关重采样功能的文档,但找不到如何完成。感谢您的帮助!
答案 0 :(得分:2)
我相信您每天需要DataFrame.groupby
并与DataFrameGroupBy.resample
链接Resampler.first
:
df = df.groupby(df.index.date).resample("1Min").first()