我想将字符串从数据帧转换为日期时间。
dfx = df.ix[:,'a']
dfx = pd.to_datetime(dfx)
但它会出现以下错误:
ValueError:day超出了月份的范围
有人可以帮忙吗?
答案 0 :(得分:11)
如果日期时间的格式为dayfirst=True
,则可以帮助将参数30-01-2016
添加到to_datetime
:
dfx = df.ix[:,'a']
dfx = pd.to_datetime(dfx, dayfirst=True)
更通用的是使用参数format
和errors='coerce'
将值替换为其他format
到NaN
:
dfx = '30-01-2016'
dfx = pd.to_datetime(dfx, format='%d-%m-%Y', errors='coerce')
print (dfx)
2016-01-30 00:00:00
样品:
dfx = pd.Series(['30-01-2016', '15-09-2015', '40-09-2016'])
print (dfx)
0 30-01-2016
1 15-09-2015
2 40-09-2016
dtype: object
dfx = pd.to_datetime(dfx, format='%d-%m-%Y', errors='coerce')
print (dfx)
0 2016-01-30
1 2015-09-15
2 NaT
dtype: datetime64[ns]
如果格式是标准格式(例如01-30-2016
或01-30-2016
),则只添加errors='coerce'
:
dfx = pd.Series(['01-30-2016', '09-15-2015', '09-40-2016'])
print (dfx)
0 01-30-2016
1 09-15-2015
2 09-40-2016
dtype: object
dfx = pd.to_datetime(dfx, errors='coerce')
print (dfx)
0 2016-01-30
1 2015-09-15
2 NaT
dtype: datetime64[ns]