我想知道如何根据每次测量之间的时间对每列进行加权平均重采样。
这是数据框的摘录(第一列是m³/ h,第二列是%):
DEBITS VOLETS
datetime
2014-01-21 00:03:03 NaN 49.93
2014-01-21 00:09:54 55.40 NaN
2014-01-21 00:12:59 NaN 47.72
2014-01-21 00:19:51 48.18 NaN
2014-01-21 00:22:57 NaN 49.44
2014-01-21 00:30:00 65.50 NaN
2014-01-21 00:33:04 NaN 49.37
2014-01-21 00:39:55 63.24 NaN
2014-01-21 00:43:00 NaN 49.69
2014-01-21 00:49:52 65.13 NaN
2014-01-21 00:52:57 NaN 48.75
2014-01-21 00:59:59 47.75 NaN
2014-01-21 01:03:05 NaN 48.50
2014-01-21 01:09:57 61.09 NaN
2014-01-21 01:13:01 NaN 48.16
2014-01-21 01:19:51 58.56 NaN
2014-01-21 01:22:57 NaN 50.09
2014-01-21 01:29:59 62.69 NaN
2014-01-21 01:33:04 NaN 48.55
2014-01-21 01:39:56 56.73 NaN
2014-01-21 01:43:01 NaN 49.06
2014-01-21 01:49:52 56.73 NaN
2014-01-21 01:52:57 NaN 48.73
2014-01-21 01:59:58 62.60 NaN
2014年7月2日修改的问题
我知道我需要使用一个函数作为“如何”的参数,但我不知道如何表达它。
df.resample('H', how='mean')
但我认为应该使用numpy库函数的np.average,但是NaN似乎会导致错误。
np.average(data['DEBITS'], weights=data.index)
如何将这两个函数联系起来以制作加权平均值?
提前感谢您的帮助。