我有一个目前正在使用的相当脏的数据库。
数据库中的日期如下:1546330742
和此2019-01-01 03:18:13
。
以前,我曾尝试使用Pandas to_datetime
函数提供的几乎所有不同的时间增量。使用秒是我最大的幸运,因为它们通常会相差几个小时,所以我将其转换为UTC,以便与我们目前拥有的数据保持一致(大约3个小时)。
执行以下操作将产生上述行为:
pd.to_datetime(df["arrival_time"], unit='s')
但是,某些数据条目导致某些绝对荒谬的转换;它们从2019-01-01 21:23:55
到1969-12-31 19:00:00
的位置。这不是全部条目,而是其中一些条目。这就是全部一个数据库/数据源。
所以总结一下:
1546330742
和2019-01-01 03:18:13
我不知道原始日期是什么,或者bigint转换成什么日期。
如何确定此原始日期的转换/在“转换率”未知的情况下如何正确转换?
我是否缺少标准? (我的印象是这些通常以毫秒为单位存储,但事实并非如此)。