我有一个这样的数据帧列表,
Name Product Quantity
0 A 1010 10
1 A 2010 12
2 B 4145 18
3 B 5225 14
4 B 6223 16
5 C 7222 18
Name Product Quantity
0 A 1010 14
1 A 2010 12
2 B 4145 21
3 B 5225 18
4 B 7565 19
5 C 7222 11
Name Product Quantity
0 A 1010 15
1 A 2010 14
2 B 4145 13
3 B 5225 15
4 B 7565 17
我要从上面的列表中获取具有相同名称的每种产品的平均数量(四舍五入)。
所需的输出是
Name Product Avg Quantity
0 A 1010 13
1 A 2010 13
2 B 4145 17
3 B 5225 16
4 B 6223 5
5 B 7565 12
6 C 7222 10
目前,除非我将每个数据帧保存到excel文件/工作表中并将其合并到excel中,否则我不知道如何在pandas
中进行此操作。我不想走那条路线,我喜欢在大熊猫里走。
我能找到较早的帖子的最近的是this。但是,这没有帮助。任何建议对实现我的输出都是很好的。
答案 0 :(得分:1)
因此,concat
首先使用所有df,然后将groupby
与mean
一起使用
yourdf=pd.concat([df1,df2,df3]).groupby(['Name','Product'])['Quantity'].mean().reset_index()
yourdf
Out[410]:
Name Product Quantity
0 A 1010 13.000000
1 A 2010 12.666667
2 B 4145 17.333333
3 B 5225 15.666667
4 B 6223 16.000000
5 B 7565 18.000000
6 C 7222 14.500000