我有一个数据框日期列,其值低于
2015-01-01
2015-02-01
2015-03-01
2015-07-01
2015-08-01
2015-10-01
2015-11-01
2016-02-01
我希望在几个月内找到这些值的差异,如下所示
date_dt diff_mnts
2015-01-01 0
2015-02-01 1
2015-03-01 1
2015-07-01 4
2015-08-01 1
2015-10-01 2
2015-11-01 1
2016-02-01 3
我尝试使用diff()
方法计算天数,然后转换为astype('timedelta64(M)')
。但在这些情况下,当天数小于30时 - 它显示的月差值为0.请告诉我,如果有任何简单的内置函数,我可以尝试在这种情况下。
答案 0 :(得分:3)
选项1
更改期间并致电diff
。
df
Date
0 2015-01-01
1 2015-02-01
2 2015-03-01
3 2015-07-01
4 2015-08-01
5 2015-10-01
6 2015-11-01
7 2016-02-01
df.Date.dtype
dtype('<M8[ns]')
df.Date.dt.to_period('M').diff().fillna(0)
0 0
1 1
2 1
3 4
4 1
5 2
6 1
7 3
Name: Date, dtype: int64
选项2
或者,在diff
上致电dt.month
,但您需要考虑一年内的差距(由于@galaxyan,解决方案得到了改善!) -
i = df.Date.dt.year.diff() * 12
j = df.Date.dt.month.diff()
(i + j).fillna(0).astype(int)
0 0
1 1
2 1
3 4
4 1
5 2
6 1
7 3
Name: Date, dtype: int64
警告(感谢发现它),这对于一年多的差距是不行的。
答案 1 :(得分:-1)
尝试以下步骤
.month
方法获取月份编号示例代码看起来像这样
df['diff_mnts'] = date_dt.month - date_dt.shift().month