如何将字符串的DataFrame列(以dd / mm / yyyy格式)转换为日期时间?
答案 0 :(得分:361)
最简单的方法是使用to_datetime
:
df['col'] = pd.to_datetime(df['col'])
它还为欧洲时代提供dayfirst
参数(但要注意this isn't strict)。
这是在行动:
In [11]: pd.to_datetime(pd.Series(['05/23/2005']))
Out[11]:
0 2005-05-23 00:00:00
dtype: datetime64[ns]
您可以传递特定的format:
In [12]: pd.to_datetime(pd.Series(['05/23/2005']), format="%m/%d/%Y")
Out[12]:
0 2005-05-23
dtype: datetime64[ns]
答案 1 :(得分:26)
如果您的日期列是“2017-01-01”格式的字符串 你可以使用pandas astype将它转换为datetime。
df['date'] = df['date'].astype('datetime64[ns]')
或使用datetime64 [D]如果你想要日精度而不是纳秒
print(type(df_launath['date'].iloc[0]))
产量
<class 'pandas._libs.tslib.Timestamp'>
与使用pandas.to_datetime
您可以尝试使用其他格式,然后'%Y-%m-%d',但至少可以这样做。
答案 2 :(得分:9)
如果要指定棘手的格式,可以使用以下内容:
df['date_col'] = pd.to_datetime(df['date_col'], format='%d/%m/%Y')
有关format
的更多详情:
答案 3 :(得分:0)
如果日期中混合使用多种格式,请别忘了设置infer_datetime_format=True
来简化生活
df['date'] = pd.to_datetime(df['date'], infer_datetime_format=True)
或者如果您想要定制的方法:
def autoconvert_datetime(value):
formats = ['%m/%d/%Y', '%m-%d-%y'] # formats to try
result_format = '%d-%m-%Y' # output format
for dt_format in formats:
try:
dt_obj = datetime.strptime(value, dt_format)
return dt_obj.strftime(result_format)
except Exception as e: # throws exception when format doesn't match
pass
return value # let it be if it doesn't match
df['date'] = df['date'].apply(autoconvert_datetime)