我在数据框的日期列中有不同日期格式的日期。 像这样:
print(df['date'].head(15))
5/27/1972
12/15/1979
10/11/1972
9/15/1992
12/9/1980
0000-00-00
2000-00-00
1988-00-00
0000-00
2000-10-10
6/25/1976
6/6/1987
8/24/1987
0000-00-00
2000-00-00
如何在数据帧熊猫的单独列中获得年份?
答案 0 :(得分:0)
首先将列转换为相同格式,然后从中提取年份。
import datetime as dt
df['date'] = df.date.apply(
lambda x: pd.to_datetime(x).strftime('%m/%d/%Y')[0])
df['year']=pd.to_datetime(df['date'], format='%m/%d/%Y').dt.year
答案 1 :(得分:0)
以下方法帮助解决问题:
df['year'] = df.date.str.extract(r'([0-9][0-9][0-9][0-9])', expand=True)