从具有“不同日期格式”的数据框中的日期列中提取年份 - python

时间:2018-01-17 07:21:21

标签: python pandas dataframe datetime-format

我在数据框的日期列中有不同日期格式的日期。 像这样:

print(df['date'].head(15))

5/27/1972
12/15/1979
10/11/1972
9/15/1992
12/9/1980
0000-00-00
2000-00-00
1988-00-00
0000-00
2000-10-10
6/25/1976
6/6/1987
8/24/1987
0000-00-00
2000-00-00

如何在数据帧熊猫的单独列中获得年份?

2 个答案:

答案 0 :(得分:0)

首先将列转换为相同格式,然后从中提取年份。

import datetime as dt

df['date'] = df.date.apply(
lambda x: pd.to_datetime(x).strftime('%m/%d/%Y')[0])

df['year']=pd.to_datetime(df['date'], format='%m/%d/%Y').dt.year

答案 1 :(得分:0)

以下方法帮助解决问题:

df['year'] = df.date.str.extract(r'([0-9][0-9][0-9][0-9])', expand=True)