如何管理熊猫重复行

时间:2020-06-14 16:28:10

标签: python pandas dataframe

如何通过删除重复元素来组织此三列数据集。

Country       Year      Temperature
US            1990       25
US            1990       27 
US            1990       24
US            1991       26
Canada        1990       20
 .             .          .

进入

Country      Year        AvgTemp
US           1990           25.33
US            1991          26
Canada       1990           20

我可以仅在“年份”和“温度”列中使用groupby进行操作。但是如果涉及到三列呢?

(P.S。我是熊猫新手)

2 个答案:

答案 0 :(得分:1)

您可以像这样在groupby()中使用多个变量

df.groupby(['Country','Year'])['Temp'].mean().reset_index()

答案 1 :(得分:1)

df.groupby(['Country', 'Year']).mean().reset_index().rename(columns={'Temperature':'AvgTemp'})