在Pandas中的数据框中添加列并计算平均值/最大值

时间:2014-08-30 01:52:38

标签: python

我是Python的Pandas库的新手,想要汇总数据结构的数据:Col A,Col B,Col C,Col D

我能够使用Pandas的groupby功能对Col A和B进行分组。然后我想要确定每个Col A / B组合的Col C的最大值和每个Col A / B组合的Col D的平均值

输出与我对数据集

运行SQL语句时的输出基本类似
SELECT Col A, Col B, Max(Col C), Average(Col D)
FROM Data
GROUP BY Col A, Col B

以下是一些代码:

groupedResults = df.groupby(["ColA","ColB"],as_index=False).sum()

更具体地说,我认为问题是如何在调用groupby函数后针对同一数据集运行2个函数。我可以总结一下,在数据中最大化,但是有新列专门显示每个字母A和B的最大和平均值是我遇到问题的地方。

0 个答案:

没有答案