在熊猫数据框的末尾提取日期

时间:2019-01-28 22:44:55

标签: python string pandas datetime dataframe

我有一列具有以下格式的数据:

bla bla bla, bla bla bla, bla bla bla, bla bla bla bla bla bla, 23/09/2012

是否有一种简便的方法可以从所有行中提取字符串末尾的日期?每次都使用相同的DD / MM / YYYY格式。

我可以在最后拆分,但是如果可以指定要在数据中出现错误的日期,那会很好。

3 个答案:

答案 0 :(得分:1)

row.split(", ")[-1]是字符串23/09/2012,现在您可以使用date模块将其提取到Date对象中。并使用try / except进行错误处理。

答案 1 :(得分:1)

您可以使用字符串切片,后跟pd.to_datetime。例如:

df['col'] = pd.to_datetime(df['col'].str[-10:], dayfirst=True)

答案 2 :(得分:1)

如果不确定日期是否在字符串末尾,请使用str.extract

df['date'] = df['col'].str.extract('(\d{2}/\d{2}/\d{4})', expand = False)

0    23/09/2012