我希望我的数据集可以追溯到过去三年(过去三年)。我已将年,月和季度列合并到一个名为' date'这是一个日期时间函数。我想用他的日期'列,以获取最近3年,具体取决于我运行报告的时间。
我想过使用.tail,但我的问题是行数会改变,因此想要根据日期列进行过滤。
在下面的代码中,您将看到我根据年份进行过滤,但实际上我需要更精确并按照3年的精确度过滤 - 例如,如果我在2个月后运行报告,它会准确地告诉我3年前。
df1= df.loc[df['YEAR'].isin(['2014','2015','2016'])]
monthend = {'Q1':'3/31','Q2':'6/30','Q3':'9/30','Q4':'12/31'}
df1['Date']=df1['QUARTER'].map(monthend)+'/'+ df1['YEAR']
df1['Date'] = pd.to_datetime(df1['Date'])
Dataframe看起来像这样:
YEAR MONTH QUARTER Fruit Sales ($) Date
2014 2 1 12 3/31/2014
2014 4 2 12 6/30/2014
2014 9 3 13 9/30/2014
2014 12 4 11 12/31/2014
2015 1 1 3 3/31/2015
2015 4 2 54 6/30/2015
2015 8 3 11 9/30/2015
2015 11 4 43 12/31/2015
2016 3 1 54 3/31/2016
2016 5 2 34 6/30/2016
2016 7 3 6 9/30/2016
2016 10 4 7 12/31/2016
2017 1 1 57 3/31/2017
有什么想法吗?
答案 0 :(得分:1)
我认为我们可以将(当前时间 - 3年)保存为变量,然后使用它过滤DataFrame。
所以
import time
then = datetime.datetime.now() - datetime.timedelta(days=3*365)
then = pd.to_datetime(then)
现在回到我们的数据框
df2 = df1[(df1['Date'] > then)]
我确信有更优雅的解决方案,但我认为这可以完成工作!
以下是我使用的来源:
pandas apply filter for boolean type