我已经看到从数据格式“ DD-MM-YYYY”等中提取日期,月份和年份。 (月份编号而不是名称)
但是,我有一个数据集,该数据集的日期格式为:“ Month_name date,year”。 例如。 “ 2019年8月30日”。
答案 0 :(得分:1)
假设您的DataFrame包含 TxtDate 列, 日期字符串:
TxtDate
0 August 30, 2019
1 May 12, 2020
2 February 16, 2020
第一步是将源列转换为 datetime 类型并保存 在新列中:
df['Date'] = pd.to_datetime(df.TxtDate)
此功能非常“聪明”,即使不显式也可以执行 格式规范。
然后提取有代表性的日期成分(并将它们保存在各自的 列):
df['Year'] = df.Date.dt.year
df['Month'] = df.Date.dt.month
df['Day'] = df.Date.dt.day
最后一步是删除 Date 列(您没有写 您需要整个日期):
df.drop(columns='Date', inplace=True)
结果是:
TxtDate Year Month Day
0 August 30, 2019 2019 8 30
1 May 12, 2020 2020 5 12
2 February 16, 2020 2020 2 16
也许您还应该删除 TxtDate 列(您的选择)。