我正在研究土地消耗和人口增长。 我有一个数据框,其中列出了一段时间内按时间顺序排列的人口。
import pandas as pd
df = pd.DataFrame({'year': [2014, 2015, 2016, 2017, 2018], 'population': [66354, 63322,83381, 91563, 93709]})
徒劳的是,我将建筑物的建造数量按年份分组。
df2 = pd.DataFrame({'year': [2014, 2015, 2016, 2017, 2018], 'numberOfBu': [1348, 900, 1137, 865, 235]})
为了与建筑物和人口之间的顺序进行比较,我应该逐年增加建筑物的征税-就像对人口值所做的那样。因此,我必须将第一个值与第二个值相加,将第三个值都与第三个值相加,依此类推。
大熊猫有解决方案吗?
答案 0 :(得分:0)
您正在搜索IIUC的累积和函数cumsum()
:
df.population.cumsum()
# 0 66354
# 1 129676
# 2 213057
# 3 304620
# 4 398329
# Name: population, dtype: int64