根据日期列熊猫过滤数据框

时间:2020-01-18 09:20:08

标签: pandas datetime pandas-groupby

我有一个熊猫数据框,如下所示。

Unit_ID    Added_Date                   Status         
105        2019-10-02 07:18:18          Rented
106        2020-15-01 07:18:17          Rented
105        2019-10-02 07:18:19          Rented
108        2020-15-01 07:18:18          Vacant

从上面,我想根据日期列找出最近10天内添加的Unit_ID。

预期输出:

Unit_ID    Added_Date                   Status         
106        2020-15-01 07:18:17          Rented
108        2020-15-01 07:18:18          Vacant

3 个答案:

答案 0 :(得分:3)

您还可以使用.dt.days访问器并将其与le 10进行比较:

#df['Added_Date']=pd.to_datetime(df['Added_Date'],format='%Y-%d-%m %H:%M:%S')
df[(pd.to_datetime('today') - df['Added_Date'] ).dt.days.le(10)]

   Unit_ID          Added_Date  Status
1      106 2020-01-15 07:18:17  Rented
3      108 2020-01-15 07:18:18  Vacant

答案 1 :(得分:2)

这是一种方法:

today = pd.to_datetime('today')
n = 10 # last n days

filter_criteria = df['Added_Date'].sub(today).abs().apply(lambda x: x.days <= n)

df.loc[filter_criteria]

     Unit_ID Added_Date           Status
106      106 2020-01-15 07:18:17  Rented
108      108 2020-01-15 07:18:18  Vacant

答案 2 :(得分:2)

这是使用pd.DateOffset

的另一种方法
from datetime import datetime
df.loc[df['Added_Date'] >= (datetime.today() - pd.DateOffset(days=10))]

   Unit_ID          Added_Date  Status
1      106 2020-01-15 07:18:17  Rented
3      108 2020-01-15 07:18:18  Vacant