我有一个数据框,由日期和三列组成,如下所示。
df = pd.DataFrame({'Date': ['01/01/2019', '02/01/2019', '03/01/2019', '04/01/2019', '05/01/2019', '06/01/2019', '07/01/2019', '08/01/2019'],
'A': [1,2,3,4,5,6,7,8],
'B': [11,12,13,14,15,16,17,18],
'C': [21,22,23,24,25,26,27,28]})
我正在尝试根据日期选择每列的部分。如果未选择,则返回零。如下。
df = pd.DataFrame({'Date': ['01/01/2019', '02/01/2019', '03/01/2019', '04/01/2019', '05/01/2019', '06/01/2019', '07/01/2019', '08/01/2019'],
'A': [1,2,0,0,5,6,7,8],
'B': [0,0,0,0,0,16,17,18],
'C': [21,22,0,0,0,0,0,0]})
在示例中,这样: 将'A'切片为01/01/2019至02/01/2019和05/01/2019为08/01/2019(或无末尾切片)。 B将在06/01/2019到08/01/2019进行切片(或者没有结束切片,因为这是最后一个数据点)。 C将被切片从01/01/2019到02/01/2019。
答案 0 :(得分:4)
据我了解,您可以尝试使用df.where()
:
df['B']=df['B'].where(df.Date.between('06/01/2019','08/01/2019'),0)
print(df)
Date A B C
0 01/01/2019 1 0 21
1 02/01/2019 2 0 22
2 03/01/2019 3 0 23
3 04/01/2019 4 0 24
4 05/01/2019 5 0 25
5 06/01/2019 6 16 26
6 07/01/2019 7 17 27
7 08/01/2019 8 18 28
您可以对所需的所有列和条件执行相同的操作。
答案 1 :(得分:1)
我会生成一个布尔掩码:
B_dates = df['Dates'][-3:]
df.loc[~df['Date'].isin(B_dates), 'B'] = 0
当然,您可以在所选的任何日期和列上进行迭代。
以下是在df上运行此代码并打印的输出:
Date A B C
0 01/01/2019 1 0 21
1 02/01/2019 2 0 22
2 03/01/2019 3 0 23
3 04/01/2019 4 0 24
4 05/01/2019 5 0 25
5 06/01/2019 6 16 26
6 07/01/2019 7 17 27
7 08/01/2019 8 18 28