Question

我想知道如何根据每次测量之间的时间对每列进行加权平均重采样。

这是数据框的摘录（第一列是m³/ h，第二列是％）：

                DEBITS  VOLETS
datetime                           
2014-01-21 00:03:03     NaN   49.93
2014-01-21 00:09:54   55.40     NaN
2014-01-21 00:12:59     NaN   47.72
2014-01-21 00:19:51   48.18     NaN
2014-01-21 00:22:57     NaN   49.44
2014-01-21 00:30:00   65.50     NaN
2014-01-21 00:33:04     NaN   49.37
2014-01-21 00:39:55   63.24     NaN
2014-01-21 00:43:00     NaN   49.69
2014-01-21 00:49:52   65.13     NaN
2014-01-21 00:52:57     NaN   48.75
2014-01-21 00:59:59   47.75     NaN
2014-01-21 01:03:05     NaN   48.50
2014-01-21 01:09:57   61.09     NaN
2014-01-21 01:13:01     NaN   48.16
2014-01-21 01:19:51   58.56     NaN
2014-01-21 01:22:57     NaN   50.09
2014-01-21 01:29:59   62.69     NaN
2014-01-21 01:33:04     NaN   48.55
2014-01-21 01:39:56   56.73     NaN
2014-01-21 01:43:01     NaN   49.06
2014-01-21 01:49:52   56.73     NaN
2014-01-21 01:52:57     NaN   48.73
2014-01-21 01:59:58   62.60     NaN

2014年7月2日修改的问题

我知道我需要使用一个函数作为“如何”的参数，但我不知道如何表达它。

df.resample('H', how='mean')

但我认为应该使用numpy库函数的np.average，但是NaN似乎会导致错误。

np.average(data['DEBITS'], weights=data.index)

如何将这两个函数联系起来以制作加权平均值？

提前感谢您的帮助。

熊猫，重新取样加权平均值

0 个答案: