计入数据帧

时间:2017-01-16 04:33:48

标签: pandas dataframe count

我的数据框如下所示

A,B,C,D
X1,desc,may 1, 1
X2,desc, june 5, 1
Y,desc, dec 8, 2
Y,desc, jan 4, 3 

我想看看X1,X2和Y.并总结,以便数据框如下所示:

A,B 
X1,1
X2,1
Y,5 

因此,对于X1的所有实例,我们总结它们,对于X2和Y来说是相同的。对此我是否有一个有用的pandas函数我不知道?我知道一个非常糟糕的解决方案,我可以将所有内容提取到列表中并查看它是否存在,然后将这种方式相加并将其转换回数据帧,但我不确定是否有更好的方法来执行此操作所有与熊猫。基本上它就像一个聚合。

1 个答案:

答案 0 :(得分:0)

如果要分组的列被设置为索引,则如下所示:

       B      C      D
   A            
   X1  desc   may    1
   X2  desc   june   1
   Y   desc   dec    2
   Y   desc   jan    3

只需使用索引分组如下:

df1.groupby([df1.index]).D.sum()

产生了预期的结果:

A
X1    1
X2    1
Y     5
Name: D, dtype: int64