需要处理多个表。每个表的一列与日期相关,但日期格式在变化,例如我使用的5 / 26、05 / 26、05 / 26 / 2020、05262020、5262020
df[date] = df[date].apply(dateutil.parser.parse, dayfirst=dayfirst,
yearfirst=yearfirst)
它曾经可以正常工作,但是最近date列中的某些表可能包含诸如"unknown"
或"missing"
或other strings
之类的字符串。然后我得到一个错误,它破坏了流程。
"ValueError: Unknown string format"
如何处理以排除我得到的行
"ValueError: Unknown string format"
谢谢。
答案 0 :(得分:0)
找出一种解决方法,先使用正则表达式排除那些行,然后应用。
df=df[df["date"].str.contains(re.compile('\d+'))]
df[date] = df[date].apply(dateutil.parser.parse, dayfirst=dayfirst,
yearfirst=yearfirst)