我有一个Pandas数据框,其中包含日期为字符串的列(以类似SQL的格式)。但是,许多单元格包含None
个值。我正在尝试使用to_datetime
将这些列转换为Pandas日期,并为包含None
值的单元格设置“默认”值。示例代码如下:
import pandas as pd
>>> d = {'a': [1,2,3],
'd1': ['2016-01-01','2015-10-02',None],
'd2': [None,'2016-04-03',None]}
>>> df = pd.DataFrame(d)
>>> print df
a d1 d2
0 1 2016-01-01 None
1 2 2015-10-02 2016-04-03
2 3 None None
>>> date_cols = ['d1','d2']
>>> df[date_cols] = df[date_cols].apply(pd.to_datetime)
>>> print df
a d1 d2
0 1 2016-01-01 NaT
1 2 2015-10-02 2016-04-03
2 3 NaT NaT
将有效字符串转换为日期非常简单,我只想将NaT
替换为default_date
。这就是我想要的最终数据框:
>>> default_date = '2015-01-01'
>>> print df
a d1 d2
0 1 2016-01-01 2015-01-01
1 2 2015-10-02 2016-04-03
2 3 2015-01-01 2015-01-01