我有一个数据框,例如:
Index Date Type Value
0 01/01/2010 A 10
1 01/01/2010 B 15
2 01/01/2010 B 25
3 01/01/2010 A 12
4 01/02/2010 A 9
5 01/02/2010 B 17
6 01/02/2010 B 20
7 01/02/2010 A 8
我想创建一个新列,以便针对每一行对基于Type和基于Date的值进行平均,因此对于给定的日期,所有具有Type A的行都将具有相同的平均值,而对于Type B将具有相同的平均值。例如,对于2010年1月1日,所有类型A的丝束将为(10 + 12)/ 2 = 11,所有类型B的行将为(15 + 25)/ 2 = 20:
Index Date Type Value Value2
0 01/01/2010 A 10 11
1 01/01/2010 B 15 20
2 01/01/2010 B 25 20
3 01/01/2010 A 12 11
4 01/02/2010 A 9 8.5
5 01/02/2010 B 17 13.5
6 01/02/2010 B 20 13.5
7 01/02/2010 A 8 8.5
答案 0 :(得分:0)
您可能想要groupby
和transform
(尽管我不确定在您期望的输出中为什么B
的类型01/02/2010
是13.5
,应该是18.5
,即 17和20的平均值):
df['Value2'] = df.groupby(['Type','Date']).Value.transform('mean')
>>> df
Index Date Type Value Value2
0 0 01/01/2010 A 10 11.0
1 1 01/01/2010 B 15 20.0
2 2 01/01/2010 B 25 20.0
3 3 01/01/2010 A 12 11.0
4 4 01/02/2010 A 9 8.5
5 5 01/02/2010 B 17 18.5
6 6 01/02/2010 B 20 18.5
7 7 01/02/2010 A 8 8.5