如何在熊猫中将日期格式“月份名称日期,年份”提取到日期,月份和年份的单独列中?例如。 “ 2019年8月30日”

时间:2020-09-30 13:45:33

标签: pandas dataframe datetime

我已经看到从数据格式“ DD-MM-YYYY”等中提取日期,月份和年份。 (月份编号而不是名称)

但是,我有一个数据集,该数据集的日期格式为:“ Month_name date,year”。 例如。 “ 2019年8月30日”。

1 个答案:

答案 0 :(得分:1)

假设您的DataFrame包含 TxtDate 列, 日期字符串:

             TxtDate
0    August 30, 2019
1       May 12, 2020
2  February 16, 2020

第一步是将源列转换为 datetime 类型并保存 在新列中:

df['Date'] = pd.to_datetime(df.TxtDate)

此功能非常“聪明”,即使不显式也可以执行 格式规范。

然后提取有代表性的日期成分(并将它们保存在各自的 列):

df['Year'] = df.Date.dt.year
df['Month'] = df.Date.dt.month
df['Day'] = df.Date.dt.day

最后一步是删除 Date 列(您没有写 您需要整个日期):

df.drop(columns='Date', inplace=True)

结果是:

             TxtDate  Year  Month  Day
0    August 30, 2019  2019      8   30
1       May 12, 2020  2020      5   12
2  February 16, 2020  2020      2   16

也许您还应该删除 TxtDate 列(您的选择)。

相关问题