我有一个数据集,并附有一个样本。我的目标是找到完成每个过程所需的平均时间。我使用以下代码:
import pandas as pd
df = pd.read_csv(....)
df['Start Time']=pd.to_datetime(df['Start Time'])
df['Finish Time']=pd.to_datetime(df['Finish Time'])
df['Process'] = df['Process'].astype("category")
df['Duration'] = df['Finish Time']-df['Start Time']
sectors = df.groupby('Process')
sectors['Duration'].mean()
但是,每当我运行代码时,都会出现以下错误:
没有要聚合的数字类型
任何帮助将不胜感激。
文件= https://filebin.net/0698p6q9or49ctw6/bb.csv?t=77zhetpd
PS: 1.这是我使用dt.days时的结果:
A 0.5
B 0.0
C 0.0
但是我正在寻找这样的东西:
平均A = 16.54305554小时
平均B = 0.67小时
平均C = 1.37小时
答案 0 :(得分:0)
我使用以下代码,并且有效:
df['Duration'] = (df['Duration']/np.timedelta64(1,'D'))*24