使用掩码按星期几过滤数据框

时间:2020-07-24 06:15:37

标签: python pandas date filter mask

我正在尝试使用遮罩过滤并显示我感兴趣的日期。这是我当前的代码:

# mask date range 
start_date = '2019-10-01'
end_date = '2019-11-01'
mask1 = (df['StartTime'] >= start_date) & (df['StartTime'] < end_date)

# mask dayofweek
mask2 = (df.StartTime.dt.dayofweek == 0)

mask = mask1 & mask2

#apply mask
df.loc[mask]

上面的代码显示mask2的一周中一天(0 =星期一)的mask1日期范围(2019-10-01至2019-11-01)中的所有日期。 但是,我对星期一至星期四有兴趣,因此我需要调整mask2。

以下是我尝试过的一些事情:

#this doesn't work:
mask2 = (0<=df.StartTime.dt.dayofweek<=3)

#this doesn't work:
mask2 = (df.StartTime.dt.dayofweek == 0) or (df.StartTime.dt.dayofweek == 1) or (df.StartTime.dt.dayofweek == 2) or (df.StartTime.dt.dayofweek == 3)

您能告诉我什么是最好的方法吗?预先谢谢你。

1 个答案:

答案 0 :(得分:0)

一种方法是提取dayofweek,然后使用isin

例如:

df = pd.DataFrame({
    "StartTime" : ['2019-10-01', '2019-10-02', '2019-10-03', '2019-10-04', '2019-10-05', '2019-10-06', '2019-10-07', '2019-10-08']
})
df["StartTime"] = pd.to_datetime(df["StartTime"], format="%Y-%m-%d")
df["dayofweek"] = df["StartTime"].dt.dayofweek

print(df[df["dayofweek"].isin([0,1,2])]['StartTime'])

输出:

0   2019-10-01
1   2019-10-02
6   2019-10-07
7   2019-10-08
Name: StartTime, dtype: datetime64[ns]