我想计算当前行和第1行之间的比率。我将行保存在另一个数据框中,计算值为True的行,然后计算值为False的行,然后找到比率。这就像比率随每个新行的变化而变化。
解决这个问题的一种方法是:
iterate between 0 to current row:
find_rows where name = 'X'
countTrue
return countTrue/totalCount
但是,我认为这不是一个合理的方法,因为我有一个400万行的DataFrame,上面的循环将计算每一行。
我正在寻找类似numpy.cumsum
的东西,同时可以灵活地仅使用第1行和当前行之间的数据。
示例DataFrame:
name attendance
0 X True
1 A False
2 B True
3 D False
4 X False
5 C True
6 Z False
7 X True
假设我在第8行,我想查看之前的所有行并计算X
的'真'比率