我是Python的Pandas库的新手,想要汇总数据结构的数据:Col A,Col B,Col C,Col D
我能够使用Pandas的groupby功能对Col A和B进行分组。然后我想要确定每个Col A / B组合的Col C的最大值和每个Col A / B组合的Col D的平均值
输出与我对数据集
运行SQL语句时的输出基本类似SELECT Col A, Col B, Max(Col C), Average(Col D)
FROM Data
GROUP BY Col A, Col B
以下是一些代码:
groupedResults = df.groupby(["ColA","ColB"],as_index=False).sum()
更具体地说,我认为问题是如何在调用groupby函数后针对同一数据集运行2个函数。我可以总结一下,在数据中最大化,但是有新列专门显示每个字母A和B的最大和平均值是我遇到问题的地方。