我的数据框如下所示
A,B,C,D
X1,desc,may 1, 1
X2,desc, june 5, 1
Y,desc, dec 8, 2
Y,desc, jan 4, 3
我想看看X1,X2和Y.并总结,以便数据框如下所示:
A,B
X1,1
X2,1
Y,5
因此,对于X1的所有实例,我们总结它们,对于X2和Y来说是相同的。对此我是否有一个有用的pandas函数我不知道?我知道一个非常糟糕的解决方案,我可以将所有内容提取到列表中并查看它是否存在,然后将这种方式相加并将其转换回数据帧,但我不确定是否有更好的方法来执行此操作所有与熊猫。基本上它就像一个聚合。
答案 0 :(得分:0)
如果要分组的列被设置为索引,则如下所示:
B C D
A
X1 desc may 1
X2 desc june 1
Y desc dec 2
Y desc jan 3
只需使用索引分组如下:
df1.groupby([df1.index]).D.sum()
产生了预期的结果:
A
X1 1
X2 1
Y 5
Name: D, dtype: int64