获得一个时间序列数据,其中数据时间数据点位于第二级且不等距-步进功能。此外,与“第二粒度”相比,数据点相当稀疏。
2019-03-02 01:03:07 1.29 USD
2019-03-02 04:13:39 1.34 USD
2019-03-02 04:58:22 1.32 USD
在该示例中,可以看到1.29的价格从01:03:07到04:13:39有效。
我如何最好地处理熊猫中的数据,以回答诸如“上周平均价格是多少”之类的问题?
我认为升采样是个好方法。但是,除非我在分钟级别上进行并接受较小的偏差,否则升采样至秒将导致许多数据点。
引入一个额外的列来覆盖每个数据点的持续时间(timedelta)将使查询变得非常困难,也许不是解决之道?