我的数据框df
,lon
,lat
和label
列
我想执行相当于此R聚合的内容:
mean_labels <- aggregate(cbind(lon, lat) ~ label, data=df, FUN=mean)
但这对我来说太神奇了。据我所知,它正在计算df中每组lat
值的lon
,label
值的平均值
但是,我不知道如何使用pandas数据帧完成此操作。我可以轻松按label
进行分组,但我不知道如何计算每个组中的平均lon
和lat
值。
答案 0 :(得分:3)
我认为这与执行groupby标签相同,然后通过平均值进行聚合:
g = df.groupby('label')
mean_labels = g[['lon', 'lat']].mean()
也就是说,对于每个标签,您可以获取lon和lat的平均值 (......这似乎是一件合理的事情。)