我正在使用德国的covid19数据集。对于德国,按月汇总cases
,deaths
和recovery
的数量可得出相同的值。有什么事吗检查dataframe
会发现它们不相同。
covid19_data.set_index("date").resample("M").agg({"deaths": "count",
"cases": "count",
"recovered": "count"})
deaths cases recovered
date
2020-01-31 7 7 7
2020-02-29 76 76 76
2020-03-31 28489 28489 28489
2020-04-30 38567 38567 38567
2020-05-31 13116 13116 13116
2020-06-30 7740 7740 7740
2020-07-31 810 810 810
答案 0 :(得分:0)
如果要汇总,您应该对值求和吗?
covid19_data.set_index("Date").resample("M").agg({"deaths": "sum",
"cases": "sum",
"recovered": "sum"})
或
df = df.groupby(by=pd.Grouper(key='date', freq='M')).sum()
deaths cases recovered
Date
2020-01-31 67 744 15
2020-02-29 68 777 17