我正在使用Jupyter笔记本中的Pandas进行一些数据分析,并逐年分析每两年的数据。从csv文件(pd.read_csv('文件位置'))提取了大约74万行数据
date_time的格式:“ dd / mm / yyyy hh:mm”-即11/11 // 2017 21:52
这是我发现的奇怪的地方,当day <= 12时,日期和月份切换,当日期是13岁及以上时,格式正确(当输入pd.Timestamp时)
一个例子:
pd.Timestamp("13/02/2018 02:26")
--> Timestamp('2018-02-13 02:26:00')
如您所愿。现在将其移至2月11日:
pd.Timestamp("12/02/2018 02:26")
--> Timestamp('2018-12-02 02:26:00')
真的不确定为什么会发生这种情况,非常感谢我如何避免这种情况的帮助。
谢谢!
答案 0 :(得分:1)
检查to_datetime
和dayfirst
pd.to_datetime("11/02/2018 02:26",dayfirst=True)
Out[22]: Timestamp('2018-02-11 02:26:00')