假设我有csv
timestamp
,但格式未定义。它可以是任何格式的任何分隔符,如 -
mm/dd/yyyy hh:mm
或dd/mm/yyyy hh:mm:ss
或mm-dd-yyyy hh:mm
或dd-mm-yyyy hh:mm:ss
或就是这样。
我正在尝试解析任何格式的日期。
下面:
dateparse = lambda dates: datetime.strptime(dates, '%m/%d/%Y %H:%M')
我们已定义以此格式解析日期:%m/%d/%Y %H:%M
如果有人可以提供任何有价值的建议,那么它将会有所帮助。
答案 0 :(得分:1)
pandas.read_csv
有一个infer_datetime_format
参数:
infer_datetime_format:boolean,默认为False
如果启用了True和parse_dates,pandas将尝试推断列中日期时间字符串的格式,如果可以推断,请切换到更快的解析方法。在某些情况下,这可以将解析速度提高约5-10倍。