使用Pandas resample()进行下采样时,如何使用fill_method或fill_na()或ffill()?

时间:2019-01-08 13:19:29

标签: python pandas data-science resampling

B“ H

我有跨国数据-即每笔交易一行。每个都有时间戳(DatetimeIndex)。但是,它们不是固定间隔的。某些日子可能有数千笔交易,有些日子却没有任何交易。

因此,如果我尝试df.resample('D'),我最终会遇到很多样本而没有样本的日子(duh!)。

我需要的是,在空闲的日子里每个日子都有一个样本(或等效的解决方案),以便统计函数将返回那些日子的数据。那些日子的最佳值是休市前的最后一个值。即ffill将是完美的。

您可能想建议在我调用统计方法后再调用ffill()。即resample('D').mean().ffill(),如果我仅对组进行一次计算,则可以使用。但是只要想一想。如果我致电resample('D').ohlc().ffill()会发生什么?然后我将以前几天的高点和低点结束。但是实际上,我应该得到的是从最后一个有效日开始的close并保留所有四个值。

ps。在fill_method中使用resample参数,或直接对ffill的结果调用resample('D')都会导致错误

  

ValueError:无法使用方法或限制重新索引非唯一索引

0 个答案:

没有答案