我在pd.read_csv()的数据框中有一个混合格式的列。关于日期时间处理的信息很多,但是对于这个特定的问题我什么也没找到:
2种数据时间类型:
自定义dd / mm / yyyy hh:mm在excel中显示为:10/03/2018 07:18
在Excel中显示的常规内容如下:8/13/2018 2:28:34 PM
我用过:
df.Last_Updated = pd.to_datetime(df['Last_Updated'])
df = df.sort_values('Last_Updated').drop_duplicates(['Name'], keep='last')
但是我混合在一起,自定义格式返回为另一种数据时间类型:
检查后将dd / mm / yyyy hh:mm(02/09/2018 17:55:44)格式更改为yyyy-mm-dd hh:mm:ss(2018-02-09 17:55: 44),并且由于我必须执行“大于”类型的排除,因此会导致错误;在这种情况下,9月最后一次连接的计算机将恢复为2月的计算机。
有人知道统一日期时间格式的方法吗?
日期格式:
通过记事本:
X = "10/2/2018 10:07:31 PM"
Y = "8/13/2018 2:28:34 PM"
来自CSV(并通过Excel打开.txt):
X = 10/02/2018 22:07 PM
Y = 8/13/2018 2:28:34 PM
在代码中应用日期时间之后:
X = 02/10/2018 22:07:31
Y = 13/08/2018 14:28:34