从月份开始的X个月筛选熊猫数据框日期列

时间:2020-10-23 21:56:07

标签: python pandas dataframe

找不到解决我问题的方法。

假设我有一个df:

df = pd.DataFrame({'col':np.random.randn(len(date_rng)),'created_at':pd.date_range('2020-01-01', '2020-12-31', freq='D')})
df

输出为:

       col      created_at
0   1.764052    2020-01-01
1   0.400157    2020-01-02
2   0.978738    2020-01-03
3   2.240893    2020-01-04
4   1.867558    2020-01-05
... ... ...
361 0.003771    2020-12-27
362 0.931848    2020-12-28
363 0.339965    2020-12-29
364 -0.015682   2020-12-30
365 0.160928    2020-12-31

所以问题是我想过滤数据框以显示最近的6个月到每月的第一天。例如,如果今天(2020年10月23日),我希望该数据框从4月1日开始提供结果。

11月时,无论11月的日期如何,第一个日期的结果应为5月1日。

有什么想法吗?

这应该是自动运行的,所以类似:

df = df[(df.created_at.dt.month >= datetime.datetime.utcnow().month)
                    & (df.created_at.dt.year==datetime.datetime.utcnow().year)]

不会工作。

谢谢!

1 个答案:

答案 0 :(得分:0)

您可以使用之间的值来分隔两个值之间的条件:

today = datetime.today()
target = today - timedelta(days=180)
df = df[lambda x: x['created_at'].between(datetime(target.year,target.month,1),today)]