我有一个包含3列的数据框
Date Col 2 Col 3
10/1/19 C1 0.5
10/1/19 C2 0.3
10/1/19 C3 0.2
10/1/19 C1 0.5
10/1/19 C2 0.3
10/1/19 C3 0.2
10/2/19 C1 0.5
10/2/19 C2 0.3
10/2/19 C3 0.2
10/2/19 C1 0.5
10/2/19 C2 0.3
10/2/19 C3 0.2
...
12/13/19 C3 0.5
我想使用第3列平均值计算每天第2列中每个唯一值的平均值。
例如,
Date Col 2 Col3 (Avg)
10/1/19 C1 0.2
10/1/19 C2 0.4
10/1/19 C3 0.3
10/2/19 C1 0.2
10/2/19 C2 0.1
...
我是python的新手,并尝试在Pandas中进行此操作,但我无法弄清楚。任何帮助表示赞赏。我能够获得整个列的平均值,但不能获得子集的平均值。
答案 0 :(得分:1)
您想要GroupBy.mean
:
df.groupby(['Date', 'Col 2'], as_index=False)['Col 3'].mean()
Date Col 2 Col 3
0 10/1/19 C1 0.5
1 10/1/19 C2 0.3
2 10/1/19 C3 0.2
3 10/2/19 C1 0.5
4 10/2/19 C2 0.3
5 10/2/19 C3 0.2