重新索引时间序列 - 理解背后的逻辑。

时间:2018-06-09 10:59:50

标签: pandas time series

我有一个移动货币交易数据集,包括交易时间,钱包ID,交易时的余额等等。

根据我的理解,如果我想计算每日,每周或每月的统计数据,我需要填补空白 - 没有交易的天数或小时 - 通过重新索引和bfill或ffill。

我担心每天重新索引数据集,填充或填充交易数据,会创建从未发生过的新交易数据,并给我错误的计算。

无论如何,我可以保留那些没有交易的日期吗?

                      TO_WALLET  FEE  TRANSACTION_AMOUNT  BALANCE  \
TRANSACTION_DATE                                                    
12/07/2017 16:06:03  ----------    0                8652    14289   
12/08/2017 00:08:11  ----------    0                  40    14249   
12/08/2017 18:58:41  ----------   15                 800    13435   
12/08/2017 19:03:28  ----------    0                 100    13335   
12/11/2017 13:46:34  ----------   56                3000    10279   
12/11/2017 14:14:27  ----------    0                  25    10254   

0 个答案:

没有答案