我使用 Pandas 0.18 和read_sas
来加载sas7bdat
数据集。
Pandas数据框中的日期显示为:
Out[56]:
0 19411.0
1 19325.0
2 19325.0
3 19443.0
4 19778.0
Name: sas_date, dtype: float64
pd.to_datetime
无法识别此格式。我该怎么办才能正确解析日期?
谢谢!
答案 0 :(得分:12)
根据this link,
[A] SAS日期值是表示日期之间的天数的值 1960年1月1日和指定日期
因此,如果我们将数字转换为Pandas Timedeltas并将其添加到
1960-1-1
我们可以恢复日期:
import numpy as np
import pandas as pd
ser = pd.Series([19411.0, 19325.0, 19325.0, 19443.0, 19778.0])
ser = pd.to_timedelta(ser, unit='D') + pd.Timestamp('1960-1-1')
产量
0 2013-02-22
1 2012-11-28
2 2012-11-28
3 2013-03-26
4 2014-02-24
dtype: datetime64[ns]