我正在使用Pandas来读取.csv文件,即'时间戳'日期列格式为:
31/12/2016 00:00
我使用以下行将其转换为datetime64
dtype:
time = pd.to_datetime(df['Timestamp'])
该列的条目对应于将近一年的每15分钟一次,当我想要超过1个月的情节时,我遇到了一个问题。
熊猫似乎在阅读后将格式从ISO更改为美国(所以YYYY:MM:DD到YYYY:DD:MM),所以每当日期时间代表新的一天时,我的情节都有30天的间隙。前5天的情节看起来像:
这是跳转任一侧的文件中的原始数据:
01/01/2017 23:45
02/01/2017 00:00
如果我在第一次跳跃周围打印正在绘制的值(读取后),我会得到:
2017-01-01 23:45:00
2017-02-01 00:00:00
那么有没有办法让熊猫正确阅读日期?
谢谢!
答案 0 :(得分:1)
您可以在format
中指定pd.to_datetime
参数,告诉大熊猫如何准确地解析日期,我想这就是您所需要的:
time = pd.to_datetime(df['Timestamp'], format='%d/%m/%Y %H:%M')
pd.to_datetime('02/01/2017 00:00')
#Timestamp('2017-02-01 00:00:00')
pd.to_datetime('02/01/2017 00:00', format='%d/%m/%Y %H:%M')
#Timestamp('2017-01-02 00:00:00')