我有一列具有以下格式的数据:
bla bla bla, bla bla bla, bla bla bla, bla bla bla bla bla bla, 23/09/2012
是否有一种简便的方法可以从所有行中提取字符串末尾的日期?每次都使用相同的DD / MM / YYYY格式。
我可以在最后拆分,但是如果可以指定要在数据中出现错误的日期,那会很好。
答案 0 :(得分:1)
row.split(", ")[-1]
是字符串23/09/2012
,现在您可以使用date
模块将其提取到Date
对象中。并使用try
/ except
进行错误处理。
答案 1 :(得分:1)
您可以使用字符串切片,后跟pd.to_datetime
。例如:
df['col'] = pd.to_datetime(df['col'].str[-10:], dayfirst=True)
答案 2 :(得分:1)
如果不确定日期是否在字符串末尾,请使用str.extract
df['date'] = df['col'].str.extract('(\d{2}/\d{2}/\d{4})', expand = False)
0 23/09/2012