熊猫到日期时间检查格式

时间:2020-02-20 08:24:54

标签: pandas datetime datetime-format python-datetime

我有几个csv文件,所有的csv文件都有一列,其日期为DD / MM / YYYY格式或MM / DD / YYYY格式。

此刻,我手动检查文件,并使用下面的代码将其转换为pandas datetime。

df["date"] = pd.to_datetime(df["date"], dayfirst=True, errors='coerce')

在不同日期格式的情况下,我将dayfirst = True / False更改为。 由于某些行包含脏数据,因此我必须强制执行错误。 我想自动执行此过程,以便仅上传文件,而pandas会自动确定列是MM / DD还是DD / MM格式。

任何提示和建议都值得赞赏。

1 个答案:

答案 0 :(得分:0)

好的,我发现了一些可行的方法:

for df in df_list:
    df_test=df["Date"].str.split("/", expand=True)
    df_test[0] = pd.to_numeric(df_test[0], errors="coerce")
    df_test[1] = pd.to_numeric(df_test[1], errors="coerce")
    a=df_test[0].max()
    b=df_test[1].max()
    if b > a:
        df["Date"] = pd.to_datetime(df["Creation Date"],dayfirst=False, errors='coerce')
    elif a > b:
        df["Date"] = pd.to_datetime(df["Creation Date"],dayfirst=True, errors='coerce')