我有一个数据框如下。
v****r@g***l.com
我希望将其转换如下:
a x 10
b x 11
c x 15
a y 16
b y 17
c y 19
a z 20
b z 21
c z 23
目前我正在将原始DF制作成多个数据框(每个数据框用于" a"," b"" c")然后转置和合并。
我相信会有一个最佳解决方案。因此寻求帮助。
答案 0 :(得分:2)
使用pivot
:
print (df)
A B C
0 a x 10
1 b x 11
2 c x 15
3 a y 16
4 b y 17
5 c y 19
6 a z 20
7 b z 21
8 c z 23
df = df.pivot(index='A', columns='B', values='C')
print (df)
B x y z
A
a 10 16 20
b 11 17 21
c 15 19 23
df = df.set_index(['A','B'])['C'].unstack()
print (df)
B x y z
A
a 10 16 20
b 11 17 21
c 15 19 23
如果重复使用pivot_table
和mean
等sum
,print (df)
A B C
0 a x 10 <-same a,x different C = 10
1 a x 13 <-same a,x different C = 13
2 b x 11
3 c x 15
4 a y 16
5 b y 17
6 c y 19
7 a z 20
8 b z 21
9 c z 23
df = df.pivot_table(index='A', columns='B', values='C', aggfunc='mean')
等汇总函数:
aggregate function
或groupby
+ df = df.groupby(['A','B'])['C'].mean().unstack()
print (df)
B x y z
A
a 11.5 16.0 20.0 <- (10 + 13) / 2 = 11.5
b 11.0 17.0 21.0
c 15.0 19.0 23.0
+ set_index
:
List