我在记录谋杀案的自治市,年份和月份的数据上具有多个索引。我试图组织我的数据框,以使行具有多个索引,分别是自治市镇和年份,然后将列数据作为月份。
我的问题是,按照目前的安排,当记录个人谋杀案时,月份列中存在重复的值。因此,例如,在2008年的某个特定区域,可能发生3项游行,因为这里发生了3起单独的谋杀案。
我要实现的是创建一个多索引数据框,其中将borough和year作为索引,将月份作为列的头,并将相应的值作为值。如何对“值”列的值求和,以便给定月份的总价值是该月发生的所有谋杀案,例如,在2016年9月,我如何在9月有一个条目,值为2? >
答案 0 :(得分:0)
尝试分组方式:
df['value'].groupby(['borough', 'year', 'month']).sum()