如何通过删除重复元素来组织此三列数据集。
Country Year Temperature
US 1990 25
US 1990 27
US 1990 24
US 1991 26
Canada 1990 20
. . .
进入
Country Year AvgTemp
US 1990 25.33
US 1991 26
Canada 1990 20
我可以仅在“年份”和“温度”列中使用groupby进行操作。但是如果涉及到三列呢?
(P.S。我是熊猫新手)
答案 0 :(得分:1)
您可以像这样在groupby()中使用多个变量
df.groupby(['Country','Year'])['Temp'].mean().reset_index()
答案 1 :(得分:1)
df.groupby(['Country', 'Year']).mean().reset_index().rename(columns={'Temperature':'AvgTemp'})