在熊猫df上运行总计

时间:2018-06-27 07:47:02

标签: python pandas running-total

我正在尝试将正在运行的count添加到pandas df

对于Column A中的值,我想添加'5',对于Column B中的值,我想添加'1'

所以对于下面的df,我希望产生:

   A  B Total
0  0  0     0
1  0  0     0
2  1  0     5
3  1  1     6
4  1  1     6
5  2  1    11
6  2  2    12

因此,integer中的每个增量Column A等于总数'5'Column B'+1'

我尝试过:

df['Total'] = df['A'].cumsum(axis = 0)

但这不包括B列

1 个答案:

答案 0 :(得分:0)

df['Total'] = df['A'] * 5 + df['B']

据我所知,您只是在进行逐行运算,而不是累积总和。此代码段计算出A的行值乘以5,并为每行添加B的行值。请不要使其变得比实际复杂。

什么是累积总和(也称为running total)?

来自维基百科:

  

考虑顺序<5 8 3 2>。这个序列的总数是多少?

     

答案:5 + 8 + 3 + 2 =18。这是通过简单地对序列求和得出的。

     

现在,我们在序列末尾插入数字6以得到<5 8 3 2 6>。该序列的总数是多少?

     

答案:5 + 8 + 3 + 2 + 6 =24。这是通过简单地对序列求和得出的。但是,如果我们将18作为运行总计,则只需将6加到18即可得出24。因此,运行总计为18,现在为24。实际上,我们甚至根本不需要知道序列,只需将6加到18就可以得到新的运行总数。每增加一个新数字,我们就会得到一个新的运行总计。