我是 Python 新手,我正在尝试使用 covid 数据集。下面显示了我的 COVID DF 的尾部。
我需要一个新列 (covid ['Daily_Confirmed']),该列减去每行中的“已确认”列,因为此功能显示聚合数据。
如果'region'、'Population'和'date'列相同,则应扣除Confirmed列中的两行。
这样一来,我们将在同一 DF 中为每个地区提供一定数量的每日确诊病例。
区域 | 人口 | 日期 | 确认 | |
---|---|---|---|---|
10889 | 小费 | 159553 | 2021-04-22 | 5719 |
10890 | 沃特福德 | 116176 | 2021-04-22 | 5542 |
10891 | Westmeath | 116176 | 2021-04-10 | 3780 |
index.php
classes
|_ Person
| |_ Person.class.php
includes
|_ autoloader.inc.php
答案 0 :(得分:2)
对@Scott Boston 的回答稍作修改
df.sort_values('date').groupby(['region', 'Population'])['Confirmed'].diff()