熊猫数据框应用功能,出现值错误

时间:2020-05-27 00:37:23

标签: pandas apply

需要处理多个表。每个表的一列与日期相关,但日期格式在变化,例如我使用的5 / 26、05 / 26、05 / 26 / 2020、05262020、5262020

  df[date] = df[date].apply(dateutil.parser.parse, dayfirst=dayfirst,
                                                         yearfirst=yearfirst)

它曾经可以正常工作,但是最近date列中的某些表可能包含诸如"unknown""missing"other strings之类的字符串。然后我得到一个错误,它破坏了流程。

 "ValueError: Unknown string format"

如何处理以排除我得到的行

"ValueError: Unknown string format"

谢谢。

1 个答案:

答案 0 :(得分:0)

找出一种解决方法,先使用正则表达式排除那些行,然后应用。

  df=df[df["date"].str.contains(re.compile('\d+'))]
  df[date] = df[date].apply(dateutil.parser.parse, dayfirst=dayfirst,
                                                     yearfirst=yearfirst)