我正在使用Pandas读取包含事件时间的工厂的excel文件,然后根据“过程”,“问题”,“问题原因”列和持续时间对数据进行分组在这个时候,我是这样的:
import pandas as pd
data = pd.read_excel('taha.xlsx',sheet_name='Data (2)')
def diff_avg(x):
d = x.diff(periods = -1).mean()
if d is not pd.NaT:
return d
else:
return '_'
gdata = data.groupby(['Process','Issue','Cause of issue']).agg({
'Duration of maintenance intervention': ['mean','std', 'min', 'max', 'sum','count'],
'Record Date':diff_avg
})
gdata
现在我有一个表,其中对数据进行了分组,在最后一列,我有事件的持续时间,到目前为止一切顺利 result 但是问题是我想计算事件与下一个事件之间的时间...因此以后对于每个组,我可以计算事件之间的时间平均值。为此,我知道我应该用上一个持续时间减去每个持续时间,并留出两个事件之间的时间,然后继续对每个组进行计算,以便计算平均值。我怎样才能做到这一点?
如果您想查看数据本身,我已经上传了数据 https://gofile.io/?c=0fAav5