我有一个熊猫数据框,如下所示。
Unit_ID Added_Date Status
105 2019-10-02 07:18:18 Rented
106 2020-15-01 07:18:17 Rented
105 2019-10-02 07:18:19 Rented
108 2020-15-01 07:18:18 Vacant
从上面,我想根据日期列找出最近10天内添加的Unit_ID。
预期输出:
Unit_ID Added_Date Status
106 2020-15-01 07:18:17 Rented
108 2020-15-01 07:18:18 Vacant
答案 0 :(得分:3)
您还可以使用.dt.days
访问器并将其与le
10进行比较:
#df['Added_Date']=pd.to_datetime(df['Added_Date'],format='%Y-%d-%m %H:%M:%S')
df[(pd.to_datetime('today') - df['Added_Date'] ).dt.days.le(10)]
Unit_ID Added_Date Status
1 106 2020-01-15 07:18:17 Rented
3 108 2020-01-15 07:18:18 Vacant
答案 1 :(得分:2)
这是一种方法:
today = pd.to_datetime('today')
n = 10 # last n days
filter_criteria = df['Added_Date'].sub(today).abs().apply(lambda x: x.days <= n)
df.loc[filter_criteria]
Unit_ID Added_Date Status
106 106 2020-01-15 07:18:17 Rented
108 108 2020-01-15 07:18:18 Vacant
答案 2 :(得分:2)
这是使用pd.DateOffset
from datetime import datetime
df.loc[df['Added_Date'] >= (datetime.today() - pd.DateOffset(days=10))]
Unit_ID Added_Date Status
1 106 2020-01-15 07:18:17 Rented
3 108 2020-01-15 07:18:18 Vacant