我在pandas数据框中有一个int64对象,它应该代表一个日期。
>>> df.dtypes
CreatedDate int64
显然,我想将其转换为日期时间,所以我做了以下
df["CreatedDate2"] = pd.to_datetime(pd.Series(df["CreatedDate"]))
>>> df[["CreatedDate","CreatedDate2"]].head()
CreatedDate CreatedDate2
0 1466461661000 1970-01-01 00:24:26.461661
1 1464210703000 1970-01-01 00:24:24.210703
2 1423576093000 1970-01-01 00:23:43.576093
3 1423611903000 1970-01-01 00:23:43.611903
4 1423617600000 1970-01-01 00:23:43.617600
>>>
然而,这是生产在20世纪70年代的日期,这不应该是真的。谁能告诉我如何在pandas数据框中将int64转换为datetime。我认为这是正确的方式。
答案 0 :(得分:3)
使用to_datetime
中的参数unit
来转换unix纪元时间:
df["CreatedDate2"] = pd.to_datetime(df["CreatedDate"], unit='ms')
print (df)
CreatedDate CreatedDate2
0 1466461661000 2016-06-20 22:27:41
1 1464210703000 2016-05-25 21:11:43
2 1423576093000 2015-02-10 13:48:13
3 1423611903000 2015-02-10 23:45:03
4 1423617600000 2015-02-11 01:20:00
答案 1 :(得分:3)
你需要传递unit='ms'
,因为它是自Unix Epoch以来的毫秒:
In[51]:
df['CreatedDate2'] = pd.to_datetime(df['CreatedDate'], unit='ms')
df
Out[51]:
CreatedDate CreatedDate2
0 1466461661000 2016-06-20 22:27:41
1 1464210703000 2016-05-25 21:11:43
2 1423576093000 2015-02-10 13:48:13
3 1423611903000 2015-02-10 23:45:03
4 1423617600000 2015-02-11 01:20:00
默认情况下,unit
参数为'ns'
,因为它假设datetime64[ns]
值,如果传递的值为int64
dtype