落后三年熊猫数据帧

时间:2017-02-06 21:01:36

标签: python pandas datetime

我希望我的数据集可以追溯到过去三年(过去三年)。我已将年,月和季度列合并到一个名为' date'这是一个日期时间函数。我想用他的日期'列,以获取最近3年,具体取决于我运行报告的时间。

我想过使用.tail,但我的问题是行数会改变,因此想要根据日期列进行过滤。

在下面的代码中,您将看到我根据年份进行过滤,但实际上我需要更精确并按照3年的精确度过滤 - 例如,如果我在2个月后运行报告,它会准确地告诉我3年前。

df1= df.loc[df['YEAR'].isin(['2014','2015','2016'])]
monthend = {'Q1':'3/31','Q2':'6/30','Q3':'9/30','Q4':'12/31'}
df1['Date']=df1['QUARTER'].map(monthend)+'/'+ df1['YEAR']
df1['Date'] = pd.to_datetime(df1['Date'])

Dataframe看起来像这样:

YEAR    MONTH   QUARTER  Fruit Sales ($)    Date
2014      2       1         12           3/31/2014
2014      4       2         12           6/30/2014
2014      9       3         13           9/30/2014
2014      12      4         11           12/31/2014
2015      1       1         3            3/31/2015
2015      4       2         54           6/30/2015
2015      8       3         11           9/30/2015
2015      11      4         43           12/31/2015
2016      3       1         54           3/31/2016
2016      5       2         34           6/30/2016
2016      7       3         6            9/30/2016
2016      10      4         7            12/31/2016
2017      1       1         57           3/31/2017

有什么想法吗?

1 个答案:

答案 0 :(得分:1)

我认为我们可以将(当前时间 - 3年)保存为变量,然后使用它过滤DataFrame。

所以

import time
then = datetime.datetime.now() - datetime.timedelta(days=3*365)
then = pd.to_datetime(then)

现在回到我们的数据框

df2 = df1[(df1['Date'] > then)]

我确信有更优雅的解决方案,但我认为这可以完成工作!

以下是我使用的来源:

pandas apply filter for boolean type

filtering pandas dataframes on dates

Subtract an year from a datetime column in pandas