B“ H
我有跨国数据-即每笔交易一行。每个都有时间戳(DatetimeIndex)。但是,它们不是固定间隔的。某些日子可能有数千笔交易,有些日子却没有任何交易。
因此,如果我尝试df.resample('D')
,我最终会遇到很多样本而没有样本的日子(duh!)。
我需要的是,在空闲的日子里每个日子都有一个样本(或等效的解决方案),以便统计函数将返回那些日子的数据。那些日子的最佳值是休市前的最后一个值。即ffill
将是完美的。
您可能想建议在我调用统计方法后再调用ffill()
。即resample('D').mean().ffill()
,如果我仅对组进行一次计算,则可以使用。但是只要想一想。如果我致电resample('D').ohlc().ffill()
会发生什么?然后我将以前几天的高点和低点结束。但是实际上,我应该得到的是从最后一个有效日开始的close
并保留所有四个值。
ps。在fill_method
中使用resample
参数,或直接对ffill
的结果调用resample('D')
都会导致错误
ValueError:无法使用方法或限制重新索引非唯一索引