我有一个看起来像这样的数据框:
Year Month Day Delay
2019 1 4 60
2018 1 10 50
2018 1 30 25
2019 1 16 42
2017 1 14 0
2019 1 16 9
2017 1 14 5
我想获取每个Delay
的平均Year
。
我认为我需要使用groupby()
,但我不知道如何对两个变量进行操作。
在another solution中,它们没有显示如何通过分组获得变量。
答案 0 :(得分:2)
IIUC,是mean
吗?
df.groupby('Year').Delay.mean()
Out[126]:
Year
2017 2.5
2018 37.5
2019 37.0
Name: Delay, dtype: float64