Pandas每10分钟输出2个月数据的平均值

时间:2018-02-08 21:59:56

标签: python-3.x pandas pandas-groupby

我在python上真的很新,我对这种情况有疑问 我有一个像这样的数据集

Client   Date                 Respuesta        SucursalId    OperationId  Cantidad
  a     2018-02-07 08:21:01   Autorizado          0115           01         1
  a     2018-02-07 08:22:05   Autorizado          0115           01         1
  a     2018-02-07 08:31:07   No Autorizado       0210           10         1
  a     2018-02-07 08:34:55   No Autorizado       0210           10         1

然后我需要设置索引

df = df.set_index(pd.DatetimeIndex(df["Date"]))

然后我需要按10分钟对事务进行分组,但我需要保留3列(Respuesta,OperationId,SucursalId)

df = df.groupby(pd.Grouper(freq="10Min")).apply(lambda x:x.groupby(["Respuesta","OperationId","SucursalId"]).sum())

我得到了这个结果(几乎是我需要的)

Date                  Respuesta      SucursalId   OperationId    Cantidad
2018-02-07 08:20:00    Autorizado        0115          01           2
2018-02-07 08:30:00    No Autorizado     0210          10           2

问题是,我有2个月的这个信息,我每天追加新的,我需要创建一个10分钟频率的平均基数,如

Date         Respuesta       SucursalId     OperationId   Mean              
08:20:00     Autorizado         0115           01           1.5 (mean of every record in 08:20:00 regardless of day)                     
08:30:00     No Autorizado      0210           10           1.7 (mean of every record in 08:30:00 regardless of day

我为我的英语道歉,我希望有人可以帮助我

0 个答案:

没有答案