汇总熊猫数据框中的列

时间:2020-07-06 12:25:33

标签: python python-3.x pandas dataframe pandas-groupby

我正在使用德国的covid19数据集。对于德国,按月汇总casesdeathsrecovery的数量可得出相同的值。有什么事吗检查dataframe会发现它们不相同。

covid19_data.set_index("date").resample("M").agg({"deaths": "count", 
                                                  "cases": "count", 
                                                  "recovered": "count"})


               deaths   cases   recovered
date            
2020-01-31        7       7        7
2020-02-29        76      76       76
2020-03-31      28489   28489    28489
2020-04-30      38567   38567    38567
2020-05-31      13116   13116    13116
2020-06-30      7740    7740     7740
2020-07-31        810    810      810

1 个答案:

答案 0 :(得分:0)

如果要汇总,您应该对值求和吗?

covid19_data.set_index("Date").resample("M").agg({"deaths": "sum", 
                                                  "cases": "sum", 
                                                  "recovered": "sum"})

df = df.groupby(by=pd.Grouper(key='date', freq='M')).sum()

            deaths  cases  recovered
Date
2020-01-31      67    744         15
2020-02-29      68    777         17