我有来自.csv文件的数百万个数据点的普通字符串,格式如下:
Datetime
22/12/2015 17:00:00
22/12/2015 18:00:00
我加载到pandas并尝试使用pandas.to_datetime(df [' Datetime'])转换为日期时间格式。但是,我得到的新时间序列数据不正确。转换过程中会产生一些新的Datetime。例如,2016-12-11 23:30:00,原始数据中不包含。
答案 0 :(得分:1)
我和panda合作已经有一段时间了,但在你的例子中,你有一个不同于csv的示例行中的日期格式:
yyyy-mm-dd hh:mm:ss
而不是
mm/dd/yyyy hh:mm:ss
to_datetime函数采用参数“format”,如果这是原因,这应该会有所帮助。
答案 1 :(得分:0)
您想使用选项dayfirst=True
pd.to_datetime(df.Datetime, dayfirst=True)
此:
Datetime
22/12/2015 17:00:00
22/12/2015 18:00:00
11/12/2015 23:30:00
转换为
0 2015-12-22 17:00:00
1 2015-12-22 18:00:00
2 2015-12-11 23:30:00
Name: Datetime, dtype: datetime64[ns]