我在python上真的很新,我对这种情况有疑问 我有一个像这样的数据集
Client Date Respuesta SucursalId OperationId Cantidad
a 2018-02-07 08:21:01 Autorizado 0115 01 1
a 2018-02-07 08:22:05 Autorizado 0115 01 1
a 2018-02-07 08:31:07 No Autorizado 0210 10 1
a 2018-02-07 08:34:55 No Autorizado 0210 10 1
然后我需要设置索引
df = df.set_index(pd.DatetimeIndex(df["Date"]))
然后我需要按10分钟对事务进行分组,但我需要保留3列(Respuesta,OperationId,SucursalId)
df = df.groupby(pd.Grouper(freq="10Min")).apply(lambda x:x.groupby(["Respuesta","OperationId","SucursalId"]).sum())
我得到了这个结果(几乎是我需要的)
Date Respuesta SucursalId OperationId Cantidad
2018-02-07 08:20:00 Autorizado 0115 01 2
2018-02-07 08:30:00 No Autorizado 0210 10 2
问题是,我有2个月的这个信息,我每天追加新的,我需要创建一个10分钟频率的平均基数,如
Date Respuesta SucursalId OperationId Mean
08:20:00 Autorizado 0115 01 1.5 (mean of every record in 08:20:00 regardless of day)
08:30:00 No Autorizado 0210 10 1.7 (mean of every record in 08:30:00 regardless of day
我为我的英语道歉,我希望有人可以帮助我