Python大熊猫:通过CSV输入统一日期时间列格式

时间:2018-10-12 12:21:00

标签: python-3.x pandas datetime

我在pd.read_csv()的数据框中有一个混合格式的列。关于日期时间处理的信息很多,但是对于这个特定的问题我什么也没找到:

2种数据时间类型:

  1. 自定义dd / mm / yyyy hh:mm在excel中显示为:10/03/2018 07:18

  2. 在Excel中显示的常规内容如下:8/13/2018 2:28:34 PM

我用过:

df.Last_Updated = pd.to_datetime(df['Last_Updated'])
df = df.sort_values('Last_Updated').drop_duplicates(['Name'], keep='last')

但是我混合在一起,自定义格式返回为另一种数据时间类型:

  1. yyyy-mm-dd hh:mm:ss并显示在我的Excel导出中为2017-11-22 19:54:35

检查后将dd / mm / yyyy hh:mm(02/09/2018 17:55:44)格式更改为yyyy-mm-dd hh:mm:ss(2018-02-09 17:55: 44),并且由于我必须执行“大于”类型的排除,因此会导致错误;在这种情况下,9月最后一次连接的计算机将恢复为2月的计算机。

有人知道统一日期时间格式的方法吗?

日期格式:

通过记事本:

    X = "10/2/2018 10:07:31 PM"
    Y = "8/13/2018 2:28:34 PM"

来自CSV(并通过Excel打开.txt):

X = 10/02/2018 22:07 PM
Y = 8/13/2018 2:28:34 PM

在代码中应用日期时间之后:

X = 02/10/2018  22:07:31
Y = 13/08/2018  14:28:34

0 个答案:

没有答案