如何在数据框中按顺序分配值

时间:2019-06-02 18:24:00

标签: python pandas dataframe

我正在研究土地消耗和人口增长。 我有一个数据框,其中列出了一段时间内按时间顺序排列的人口。

import pandas as pd
df = pd.DataFrame({'year': [2014, 2015, 2016, 2017, 2018], 'population': [66354, 63322,83381, 91563, 93709]})

徒劳的是,我将建筑物的建造数量按年份分组。

df2 = pd.DataFrame({'year': [2014, 2015, 2016, 2017, 2018], 'numberOfBu': [1348, 900, 1137, 865, 235]})

为了与建筑物和人口之间的顺序进行比较,我应该逐年增加建筑物的征税-就像对人口值所做的那样。因此,我必须将第一个值与第二个值相加,将第三个值都与第三个值相加,依此类推。

大熊猫有解决方案吗?

1 个答案:

答案 0 :(得分:0)

您正在搜索IIUC的累积和函数cumsum()

df.population.cumsum()
# 0     66354
# 1    129676                                               
# 2    213057                                           
# 3    304620                                               
# 4    398329                                                
# Name: population, dtype: int64