如何计算数据集中的移动平均线?

时间:2019-01-17 10:09:57

标签: python pandas

我有以下熊猫DataFrame df

datetime          year  month  day hour event impression
31/12/2017 11:20  2017  12     31  11   A1    22.30
31/12/2017 11:55  2017  12     31  11   A2    25.00
31/12/2017 12:05  2017  12     31  12   B1    21.15
31/12/2017 12:20  2017  12     31  12   C3    22.45
01/01/2018 10:00  2018  1      1   10   A3    24.35
01/01/2018 10:30  2018  1      1   10   A1    23.00
01/01/2018 11:15  2018  1      1   11   C3    22.61

我需要使用2个小时的切片窗口来计算平均值impression。换句话说,对于DataFrame df的每一行,我想创建一个新字段impression_last2hours。该字段在最近2小时内应平均包含impression(考虑年,月和日的变化)。

如果最近2小时的数据不可用,则的值应等于impression_last2hours。如果最近2个小时中至少有impression个值可用,那么应使用可用值来计算impression_last2hours

我可以使用哪些功能来完成此任务?我应该使用移动平均线吗?

0 个答案:

没有答案