我正在使用的数据库显示每个季度每个城镇的债务人总数。 由于列出了43个城镇,因此每个季度有43个“总债务人”(17年9月30日,等等)。
我的目标是找到每个季度的债务人总数(因此,从理论上讲,列出列出的每43个“债务人总数”之和),但我不确定如何做到。
我已经尝试过使用sum()函数,但是我确定如何做到这一点,因此它只能按季度添加总数。
这是数据库的外观以及我的尝试(我打印了前50行只是为了提供它的外观)
https://i.imgur.com/h1y43j8.png
对不起,如果解释不清楚,请提前
。答案 0 :(得分:0)
您应该使用groupby
。这是一个很好的熊猫函数,可以准确执行您要尝试执行的操作。它将根据您选择的任何列对df
进行分组。
total_debtors_pq = df.groupby('Quarter end date')['Total number of debtors'].sum()
然后您可以从total_debtors_pq
中提取每个季度的总数。