Question

我的数据框df，lon，lat和label列

我想执行相当于此R聚合的内容：

mean_labels <- aggregate(cbind(lon, lat) ~ label, data=df, FUN=mean)

但这对我来说太神奇了。据我所知，它正在计算df中每组lat值的lon，label值的平均值

但是，我不知道如何使用pandas数据帧完成此操作。我可以轻松按label进行分组，但我不知道如何计算每个组中的平均lon和lat值。

Answer 1

我认为这与执行groupby标签相同，然后通过平均值进行聚合：

g = df.groupby('label')

mean_labels  = g[['lon', 'lat']].mean()

也就是说，对于每个标签，您可以获取lon和lat的平均值（......这似乎是一件合理的事情。）