我的数据集中有一列如下所示:
date
41245.0
41701.0
36361.0
我需要将其转换为日期格式。当我使用以下命令在Python中尝试时:
df = pd.to_datetime(df['date'])
我的结果是这样的:
1 1970-01-01 00:00:00.000041701
4 1970-01-01 00:00:00.000042226
5 1970-01-01 00:00:00.000039031
这些年似乎很奇怪。但是,当我在Google云端硬盘/ Sheets上打开数据集(作为Excel工作表)时,选择该列,然后使用“日期”或“日期时间”格式对其进行格式化,结果会大不相同。
12/2/2012
3/3/2014
7/20/1999
我的结果应该是这样的。但是,目前我正在获得怪异的价值观。同样,Microsoft Excel上的结果也略有不同。为什么日期不同?我在做什么错了?
答案 0 :(得分:3)
那是几天,但原点是1900-01-01,而不是默认的1970-01-01
pd.to_datetime(df.date,unit='d',origin='1900-01-01')
Out[205]:
0 2012-12-04
1 2014-03-05
2 1999-07-22
Name: date, dtype: datetime64[ns]