应用错误收集

B“ H

我有跨国数据-即每笔交易一行。每个都有时间戳（DatetimeIndex）。但是，它们不是固定间隔的。某些日子可能有数千笔交易，有些日子却没有任何交易。

因此，如果我尝试df.resample('D')，我最终会遇到很多样本而没有样本的日子（duh！）。

我需要的是，在空闲的日子里每个日子都有一个样本（或等效的解决方案），以便统计函数将返回那些日子的数据。那些日子的最佳值是休市前的最后一个值。即ffill将是完美的。

您可能想建议在我调用统计方法后再调用ffill()。即resample('D').mean().ffill()，如果我仅对组进行一次计算，则可以使用。但是只要想一想。如果我致电resample('D').ohlc().ffill()会发生什么？然后我将以前几天的高点和低点结束。但是实际上，我应该得到的是从最后一个有效日开始的close并保留所有四个值。

ps。在fill_method中使用resample参数，或直接对ffill的结果调用resample('D')都会导致错误

ValueError：无法使用方法或限制重新索引非唯一索引

使用Pandas resample（）进行下采样时，如何使用fill_method或fill_na（）或ffill（）？

0 个答案: