我有以下熊猫DataFrame df
:
datetime year month day hour event impression
31/12/2017 11:20 2017 12 31 11 A1 22.30
31/12/2017 11:55 2017 12 31 11 A2 25.00
31/12/2017 12:05 2017 12 31 12 B1 21.15
31/12/2017 12:20 2017 12 31 12 C3 22.45
01/01/2018 10:00 2018 1 1 10 A3 24.35
01/01/2018 10:30 2018 1 1 10 A1 23.00
01/01/2018 11:15 2018 1 1 11 C3 22.61
我需要使用2个小时的切片窗口来计算平均值impression
。换句话说,对于DataFrame df
的每一行,我想创建一个新字段impression_last2hours
。该字段在最近2小时内应平均包含impression
(考虑年,月和日的变化)。
如果最近2小时的数据不可用,则的值应等于impression_last2hours
。如果最近2个小时中至少有impression
个值可用,那么应使用可用值来计算impression_last2hours
。
我可以使用哪些功能来完成此任务?我应该使用移动平均线吗?