我有一个数据框,其中包含一个月内每10秒的数据。我需要计算15分钟,8小时和24小时的数据移动平均值。如何使用Python做到这一点?
这是我的数据集:
RecTime NO2_RAW NO2 Ox_RAW Ox CO_RAW CO SO2_RAW SO2
05/31/19 13:42 0 19.13 2225 4480.35 6503.1 7687.33 -3183.6 -8181.55
05/31/19 13:42 17 51.64 1711.2 3454.96 6502.7 7686.86 -3183.6 -8181.55
05/31/19 13:42 48.4 111.69 1387.7 2809.35 6501.9 7685.93 -3183.6 -8181.55
05/31/19 13:42 60.1 134.07 1173.6 2382.07 6501.4 7685.35 -3183.6 -8181.55
05/31/19 13:42 63.9 141.33 1025.6 2086.7 6501 7684.88 -3183.6 -8181.55
我尝试使用以下代码
> Gas_432_15min = Gas_432.resample(rule='15Min', on='RecTime').mean()
但是我认为这并不是在计算滚动平均值。
答案 0 :(得分:1)
有rolling
可以满足您的需求,但需要datetimeIndex
:
Gas_432.RecTime = pd.to_datetime(Gas_432.RecTime)
Gas_432.set_index('RecTime').rolling('15T').mean()
对于此数据框,您得到了:
+---------------------+--------+---------+---------+---------+---------+---------+---------+----------+
| 2019-05-31 13:42:00 | 0 | 19.13 | 2225 | 4480.35 | 6503.1 | 7687.33 | -3183.6 | -8181.55 |
| 2019-05-31 13:42:00 | 8.5 | 35.385 | 1968.1 | 3967.66 | 6502.9 | 7687.09 | -3183.6 | -8181.55 |
| 2019-05-31 13:42:00 | 21.8 | 60.82 | 1774.63 | 3581.55 | 6502.57 | 7686.71 | -3183.6 | -8181.55 |
| 2019-05-31 13:42:00 | 31.375 | 79.1325 | 1624.38 | 3281.68 | 6502.27 | 7686.37 | -3183.6 | -8181.55 |
| 2019-05-31 13:42:00 | 37.88 | 91.572 | 1504.62 | 3042.69 | 6502.02 | 7686.07 | -3183.6 | -8181.55 |
+---------------------+--------+---------+---------+---------+---------+---------+---------+----------+
第一列为datetimeIndex
,另一列与Gas_432
相同。