当要按[col1,col2,col3]分组的数据时,我想为col5计算平均值| sum | user_Defined,并将该值存储在新列中,例如col6。
我想要上面提到的所有函数的通用函数。
不需要动态功能。
输入数据:
col1 col2 col3 col4 col5
R1 2 3 4 5
R2 3 3 5 6
R1 2 3 3 6
expected_output:
col1 col2 col3 col4 col5 col6
R1 2 3 4 5 5.5
R2 3 3 5 5 6
R1 2 3 3 6 5.5
我尝试了以下代码,但没有得到预期的输出。
语法:
data.groupby(['col1','col2','col3'],as_index=False).agg({'col5':'mean'})
谁能帮我解决这个问题。
非常感谢。