月差YYYYMM熊猫

时间:2018-03-08 12:44:07

标签: python-3.x pandas

我在数据框中有两个日期列,它们是float类型,所以我把它转换为日期格式YYYYMM。现在我必须找到两者之间的差异 他们。我尝试了下面的内容,但是我发现了错误。

df['Date_1'] = pd.to_datetime(df['Date_1'], format = '%Y%m%d').dt.strftime('%Y%m') #Convert float to YYYYMM Format
df['Date_2'] = pd.to_datetime(df['Date_2'], format='%Y%m.0').dt.strftime('%Y%m') #Convert float to YYYYMM Format
df['diff'] = df['Date_1'] - df['Date_2'] #Gives error

1 个答案:

答案 0 :(得分:1)

我认为需要减去由to_period创建的句点:

df = pd.DataFrame({'Date_1':[20150810, 20160804],
                   'Date_2':[201505.0, 201602.0]})

print (df)
     Date_1    Date_2
0  20150810  201505.0
1  20160804  201602.0

df['Date_1'] = pd.to_datetime(df['Date_1'], format = '%Y%m%d').dt.to_period('m') 
df['Date_2'] = pd.to_datetime(df['Date_2'], format='%Y%m.0').dt.to_period('m') 
df['diff'] = df['Date_1'] - df['Date_2'] 
print (df)
   Date_1  Date_2 diff
0 2015-08 2015-05    3
1 2016-08 2016-02    6

另一种解决方案是将Date_1转换为月的第一天:

df['Date_1'] = pd.to_datetime(df['Date_1'], format = '%Y%m%d') - pd.offsets.MonthBegin()
df['Date_2'] = pd.to_datetime(df['Date_2'], format='%Y%m.0')
df['diff'] = df['Date_1'] - df['Date_2'] 
print (df)
      Date_1     Date_2     diff
0 2015-08-01 2015-05-01  92 days
1 2016-08-01 2016-02-01 182 days